- 研究領域
- 人とAIの共生・協働社会を実現する学際的システム基盤の創出
- 研究期間
- 2025年10月 ~ 2031年3月
- 研究代表者
- 戸次大介(お茶の水女子大学・基幹研究院自然科学系情報科学専攻・教授)
- 主たる共同研究者
- 河原大輔(早稲田大学・理工学術院・教授)/ 松崎拓也(東京理科大学・理学部第一部応用数学科・教授)/ 大関洋平(東京大学・大学院総合文化研究科・准教授)/ 谷中瞳(東京大学・大学院情報理工学系研究科・准教授)
- 外部リンク
- JST公式ページ
大規模言語モデル(LLM)の実応用には,検証手法の問題(LLMによる推論の妥当性を原理的に示せない)と改善手法の問題(LLMがブラックボックスであり操作が困難)という2つの課題が存在する.
本研究はこれらの問題の解決策として,言語学的パイプライン(LP)を媒介とした,人とLLMの間の新しいフィードバックループを提案する(図1).言語学的パイプラインは形式統語論・形式意味論・高階論理推論に基づく自然言語理解システムであり,計算履歴が言語理論による説明となるという透明性を持つ.言語諸科学の専門家がLPを操作し,LLMの推論を検証するとともにLLMへの報酬モデルを提供することで,説明性・信頼性を伴ったLLMの社会実装を目指す.
研究項目
- 研究項目1:チューリングテスト2.0の開発(全グループ)
- 理論言語学・心理言語学・自然言語処理・言語哲学の叡智を結集し,現行LLMには解けない人間特有の言語能力を測るベンチマークを開発する.
- 研究項目2:最先端LLMの精度上限を達成(河原G)
- プロセス報酬モデルや強化学習を活用してLLMを最大限に進化させ,チューリングテスト2.0における性能上限を確立する.
- 研究項目3:言語学的パイプラインの精度上限を達成(戸次G)
- 自然言語推論システムlightblueを改良し,*CCG文法・依存型意味論(DTS)に基づく推論の精度上限を確立する.
- 研究項目4:フィードバックループ創成(河原G・谷中G)
- LPをLLMへの高階論理推論による報酬モデルとして活用し(4A),LLMの出力の妥当性をLPで検証する仕組みを構築する(4B).
- 研究項目5:実社会応用(全グループ)
- ファクトチェック・契約書審査・特許調査等のタスクに,LLMとLPの融合技術を応用する.

