
トランスコスモスグループのAIコンサルティング会社、マシンラーニング・ソリューションズは、トランスコスモスの創業者(ファウンダー)、故 奥田耕己の理念継承を目的とした人物再現AI「ファウンダーAI」を開発しました。
「ファウンダーAI」は、奥田耕己の写真1枚と講演録をもとに応答内容・声・姿を再現し、外部AIサービスに依存しない完全ローカル環境においてリアルタイム対話を実現したものです。
取り組みの背景と概要
トランスコスモスの創業者である奥田耕己から直接薫陶を受けた人物が年々少なくなる中で、その思想・経営観をリアルに伝承するための新たな手段が求められていました。マシンラーニング・ソリューションズは、創業者の理念を次世代に継承していくことを目的に、トランスコスモスの協力のもと、最新の生成AI技術を活用した人物再現AIの開発を進めてきました。
この度開発した人物再現AIは、ユーザーの質問に対し、奥田耕己本人がその場で答えているような体験を提供します。タブレットや入力画面から受け取った質問に対して、奥田耕己本人の考え方を反映した応答を生成し、本人の声で読み上げ、3Dアバターが音声に合わせて口・表情を動かしながら回答します。
技術概要
通常、応答文がすべて生成されてから音声合成・映像生成へ進む構成となるところを、生成された文字列から順次後続の工程に流す構成としました。処理手順を最適化することで応答時間を大幅に短縮し(図1)、奥田耕己がその場で応じているような対話体験を実現しています(図2)。


さらに、応答生成・音声合成・アバター生成のAIモデルはMac mini上で動作する構成です。外部AIサービスやインターネット接続に依存せずに利用できます。機密性の高い場面でも安心してご活用いただけます。
- 応答モデル:オープンソースの言語モデルに対し、講演録から構築した質問・回答データを用いて奥田耕己らしい応答スタイルを実現するよう追加学習を実施。さらに、対応範囲外の話題には応答しないようにする学習を行うことで、安全性と応答品質を両立しました。
- 音声合成モデル:ローカル環境でのリアルタイム推論に適した軽量・高品質な音声合成方式を採用。クリアな講演音声を厳選して学習させ、声質・口調・テンポの再現性と聞き取りやすさを両立しました。
- アバター合成:写真1枚から立体的なアバターを生成する技術を活用。アバターを応答音声に合わせて動かす方式とすることで計算負荷を抑え、ローカル環境でのリアルタイム応答を実現しました。
今後の展望
講演録以外の資料を学習データに加えて回答できる範囲を広げるとともに、奥田耕己をよく知る人物による評価フィードバックを取り込み、応答品質を継続的に向上させていきます。また、本プロジェクトで構築した、リアルタイムアバター対話AIの構築技術は、理念の継承にとどまらず、人材育成、教育、文化財・記録保存など、幅広い領域への応用が期待されます。
トランスコスモスは現在、グループ全体でAIの活用を強力に推し進めています。グループ各社におけるAI活用の取り組みへ展開し、お客様企業への価値提供およびDXの加速に貢献してまいります。
各社の役割
- [開発]
-
- マシンラーニング・ソリューションズ株式会社:応答モデル・音声合成モデル・アバター合成およびシステム統合の研究開発、ローカル環境向け最適化
- [協力]
-
- トランスコスモス株式会社:奥田耕己の理念・思想に関する監修、応答内容の評価および「ファウンダーらしさ」の継承に関するアドバイザリ、奥田耕己に関する記録資料の提供
マシンラーニング・ソリューションズ株式会社について
クライアントのAIに関する課題を解決するため、技術支援・コンサルティングから研究開発、サービス開発まで幅広く行っています。学術会議でも活躍するAIの専門家集団が、生成AIやAI Agentを現場で使える形になるまで伴走支援します。
