Bekki Laboratory — Daisuke Bekki

JST CREST「言語諸科学の協働による人・LLM間のフィードバックループ創出」

研究領域: 人とAIの共生・協働社会を実現する学際的システム基盤の創出
研究期間: 2025年10月～ 2031年3月
研究代表者: 戸次大介（お茶の水女子大学・基幹研究院自然科学系情報科学専攻・教授）
主たる共同研究者: 河原大輔（早稲田大学・理工学術院・教授）／松崎拓也（東京理科大学・理学部第一部応用数学科・教授）／大関洋平（東京大学・大学院総合文化研究科・准教授）／谷中瞳（東京大学・大学院情報理工学系研究科・准教授）
外部リンク: JST公式ページ

研究概要

大規模言語モデル（LLM）の実応用には，検証手法の問題（LLMによる推論の妥当性を原理的に示せない）と改善手法の問題（LLMがブラックボックスであり操作が困難）という2つの課題が存在する．

本研究はこれらの問題の解決策として，言語学的パイプライン（LP）を媒介とした，人とLLMの間の新しいフィードバックループを提案する（図1）．言語学的パイプラインは形式統語論・形式意味論・高階論理推論に基づく自然言語理解システムであり，計算履歴が言語理論による説明となるという透明性を持つ．言語諸科学の専門家がLPを操作し，LLMの推論を検証するとともにLLMへの報酬モデルを提供することで，説明性・信頼性を伴ったLLMの社会実装を目指す．

研究項目

研究項目1：チューリングテスト2.0の開発（全グループ）: 理論言語学・心理言語学・自然言語処理・言語哲学の叡智を結集し，現行LLMには解けない人間特有の言語能力を測るベンチマークを開発する．
研究項目2：最先端LLMの精度上限を達成（河原G）: プロセス報酬モデルや強化学習を活用してLLMを最大限に進化させ，チューリングテスト2.0における性能上限を確立する．
研究項目3：言語学的パイプラインの精度上限を達成（戸次G）: 自然言語推論システムlightblueを改良し，*CCG文法・依存型意味論（DTS）に基づく推論の精度上限を確立する．
研究項目4：フィードバックループ創成（河原G・谷中G）: LPをLLMへの高階論理推論による報酬モデルとして活用し（4A），LLMの出力の妥当性をLPで検証する仕組みを構築する（4B）．
研究項目5：実社会応用（全グループ）: ファクトチェック・契約書審査・特許調査等のタスクに，LLMとLPの融合技術を応用する．