JST CREST「言語諸科学の協働による人・LLM間のフィードバックループ創出」
研究領域
人とAIの共生・協働社会を実現する学際的システム基盤の創出
研究期間
2025年10月 ~ 2031年3月
研究代表者
戸次大介(お茶の水女子大学・基幹研究院自然科学系情報科学専攻・教授)
主たる共同研究者
河原大輔(早稲田大学・理工学術院・教授)/ 松崎拓也(東京理科大学・理学部第一部応用数学科・教授)/ 大関洋平(東京大学・大学院総合文化研究科・准教授)/ 谷中瞳(東京大学・大学院情報理工学系研究科・准教授)
外部リンク
JST公式ページ
研究概要

大規模言語モデル(LLM)の実応用には,検証手法の問題(LLMによる推論の妥当性を原理的に示せない)と改善手法の問題(LLMがブラックボックスであり操作が困難)という2つの課題が存在する.

本研究はこれらの問題の解決策として,言語学的パイプライン(LP)を媒介とした,人とLLMの間の新しいフィードバックループを提案する(図1).言語学的パイプラインは形式統語論・形式意味論・高階論理推論に基づく自然言語理解システムであり,計算履歴が言語理論による説明となるという透明性を持つ.言語諸科学の専門家がLPを操作し,LLMの推論を検証するとともにLLMへの報酬モデルを提供することで,説明性・信頼性を伴ったLLMの社会実装を目指す.

図1:フィードバックループの概要 研究項目
研究項目1:チューリングテスト2.0の開発(全グループ)
理論言語学・心理言語学・自然言語処理・言語哲学の叡智を結集し,現行LLMには解けない人間特有の言語能力を測るベンチマークを開発する.
研究項目2:最先端LLMの精度上限を達成(河原G)
プロセス報酬モデルや強化学習を活用してLLMを最大限に進化させ,チューリングテスト2.0における性能上限を確立する.
研究項目3:言語学的パイプラインの精度上限を達成(戸次G)
自然言語推論システムlightblueを改良し,*CCG文法・依存型意味論(DTS)に基づく推論の精度上限を確立する.
研究項目4:フィードバックループ創成(河原G・谷中G)
LPをLLMへの高階論理推論による報酬モデルとして活用し(4A),LLMの出力の妥当性をLPで検証する仕組みを構築する(4B).
研究項目5:実社会応用(全グループ)
ファクトチェック・契約書審査・特許調査等のタスクに,LLMとLPの融合技術を応用する.
図2:研究項目と研究計画年表