アラヤ 研究開発部 強化学習チームの論文が『Frontiers in Computational Neuroscience』誌に掲載されました

2024年6月14日付で、株式会社アラヤ 研究開発部 強化学習チーム(チームリーダー:Kai Arulkumaran)に所属するシニアリサーチャーのRousslan Dossaが筆頭著者として執筆した論文「Design and evaluation of a global workspace agent embodied in a realistic multimodal environment」(DOI:https://doi.org/10.3389/fncom.2024.1352685)が学術誌『Frontiers in Computational Neuroscience』に掲載されました。

背景
意識の本質を理解するためには、意識がどのように機能するかについて仮説を立て、それを実証することで、その根底にあるメカニズムをより深く調査する必要があります。これまで、いくつかの意識理論をAIエージェントに実装する試みはなされてきたものの、単純な条件下での検証に止まっていました。

概要
今回、株式会社アラヤと米国マイクロソフトリサーチの共同研究チームは、グローバル・ワークスペース(以下、GW)理論 (※1) の基準を満たすAIエージェントを開発し、エージェントが写実的な3Dシミュレーター内で音に従って目標地点を探すというナビゲーションタスクを実行しました。その結果、記憶サイズが小さい場合、GWモジュールを持つエージェントはGWモジュールを持たない標準エージェントよりも優れたパフォーマンスを示す一方で、記憶サイズが大きくなると、これらのパフォーマンスには差が見られなくなることが明らかになりました。

エージェントは、短い音声信号 (左) と視覚的な観察 (中央) の記憶に基づいて、マップ (右) に示されているように部屋内のターゲットまで移動します。

本研究は、より現実に近い条件下で意識理論を検証することの重要性を強調しています。今回、複雑な環境におけるGW理論の実装が成功したことで、意識をより深く理解するためにAIエージェントを使用する試みが大きく進展したと言えます。

本研究で用いられたコードは、この分野のさらなる開発を促進するためにオープンソース化されています。コードは GitHub からアクセス可能です。

今後の展望
本研究は、GWを実装したエージェントの有用性を明らかにしました。また、AIエージェントを用いて意識理論がどのように研究されうるかについて新たな方向性を示しました。

用語解説
*1)グローバル・ワークスペース理論:ヒトの脳内で意識がどのように作用するかを理解するための主要な理論的枠組みの一つ。

関連リンク
強化学習チーム – チームページ
Design and evaluation of a global workspace agent embodied in a realistic multimodal environment (Frontiers in Computational Neuroscience)
GitHub - multimodal-global-workspace-agent