強化学習チーム - ARAYA Research

強化学習チーム

強化学習チームは、生物知能と人工知能の横断的な分野であるブレイン・ロボット・インターフェースに焦点を当てた研究開発に取り組んでいます。研究開発を通して、人々が外部ロボットアームを制御することで掃除や料理などの日常のさまざまなタスクを行えるようなブレイン・ロボット・インターフェースを構築することを目指しています。
また、本チームはムーンショット目標１金井プロジェクト「Internet of Brains」に参画しています。

強化学習（RL：Reinforcement Learning）とは、不確実性のある状況下で、連続的な意思決定を行う方法を研究する分野であり、自律エージェントを開発するための基礎となります。強化学習では、エージェントは課題を達成するために、環境の探索か試行錯誤によって学習した方策活用のトレードオフが必要になります。しかし、ロボティクスにおいては、エージェントの探索に危険が伴うため、私たちのAI研究では主に模倣学習（IL：Imitation Learning）に焦点を当てています。模倣学習では、エージェントは探索ではなく、デモンストレーションデータから学習を行います。私たちは模倣学習の基本原理についての研究を実施し [1]、模倣学習の研究用のオープンソースライブラリも公開しました。

過去のロボット制御の研究 [2]では、Perceiver-Actorという模倣学習アルゴリズムの改良も提案しました。このアルゴリズムは3Dボクセルと従来のロボットプランナーを活用しており、特にデータ効率に優れた手法となっています。わずか30回程度のデモンストレーションで、引き出しの開閉や物を拾って置くといったタスクを学習することができます。

ヒューマン・コンピューター・インタラクション（HCI）の研究では、結果を定量化できることが重要です。そのため、私たちは複数のロボットを同時に制御できる、定性的・定量的な指標を含むウェブベースのユーザーインターフェースを開発しました [4]。私たちのソフトウェアは、マウス、キーボード、ゲームパッド、視線追跡装置、EMGなど、複数の入力デバイスをサポートしています。

脳信号の解析に関して、私たちは現在、EEGデコーダーのキャリブレーションに必要なデータ収集を最小限に抑えたオンライン解読に焦点を当てています。さらに、フィルタリング、CSPなどの特徴量抽出、サポートベクターマシン（SVM）などの「浅いニューラルネットワーク」分類器を使用した従来のEEGパイプラインを、適切な機械学習の手法と組み合わせることが、この領域では最適な手法であると考えています。

私たちの研究の大部分はブレイン・ロボット・インターフェースに関するものですが、AIと神経科学の交差点における基礎的な研究も行っています。具体的には、AIを意識の理論の研究に役立てられると考えています [6]。私たちはグローバル・ワークスペース理論の4つの指標すべてを満たす最初のAIエージェントの実装にも成功しました [7]。

Members

Kai Arulkumaran, Ph.D.

リサーチチームリーダー

Kaiはアラヤのリサーチチームリーダー。2012年にケンブリッジ大学でコンピューターサイエンスの学士号を、2020年にインペリアル・カレッジ・ロンドンでバイオエンジニアリングの博士号を取得。これまでにDeepMind、Microsoft Research、Facebook AI Research、Twitter Cortex、NNAISENSEに勤務。研究テーマはディープラーニング、強化学習、進化計算、理論神経科学。

Manuel Baltieri, Ph.D.

チーフリサーチャー

Arayaの主任研究員、サセックス大学の客員研究員。トレント大学でコンピュータ工学と経営学の学士号を取得後、サセックス大学で進化・適応システムの修士号とコンピュータ科学とAIの博士号を取得。その後、日本学術振興会・英国王立協会特別研究員を経て、2021年末にアラヤに入社するまで、理化学研究所CBSの神経計算・適応研究室で豊泉太郎と共同研究を行う。研究テーマは、人工知能・人工生命、エージェンシーと個性の理論、生命の起源、身体化認知、意思決定など。

Rousslan Dossa, Ph.D.

チーフリサーチャー

アラヤ主席研究員。2023年に神戸大学で博士号を取得。自己教師付き学習を中心とした深層強化学習、人間の認知にインスパイアされた意思決定、神経科学、進化コンピューティングの研究に従事。

Shivakanth Sujit

シニアリサーチャー

シヴァカントはアラヤの上級研究員。2023年にミラ・ケベックでサミラ・エブラヒミ・カホウ教授のもとで修士号を取得。ロボット工学とLLMのための深層強化学習に興味がある。Milaに入社する以前は、インドのNIT Trichyで制御工学の学士課程を修了し、このバックグラウンドが、実世界で安全に相互作用できるエージェントを構築するために、制御理論とRLからの洞察を組み合わせる研究の原動力となっている。

秋山祥伍

シニアリサーチャー

祥吾は、アラヤのシニアリサーチャーです。2019年にコンピュータサイエンスのB.S.を取得。以前はAIやWebアプリケーションのエンジニアとして働いていた。研究テーマは強化学習と自然言語処理。

Marina Di Vincenzo

シニアリサーチャー

マリナは、アラヤのシニアリサーチャーです。2017年にウルビーノ大学「カルロ・ボー」で心理学の学士号を、2021年にローマ大学「ラ・サピエンツァ」で神経科学と心理リハビリテーションの修士号を、同年、国家研究会議認知科学技術研究所（ISTC-CNR）で人工知能のディプロマを取得。研究テーマは「神経技術支援におけるユーザー中心設計」。

Hannah Kodama Douglas

シニアリサーチャー

ハンナはアラヤの上級研究員です。2020年にカーネギーメロン大学で統計学の学士号を取得した後、米国国立衛生研究所(NIH)の神経計算・行動学ユニットで博士号を取得しました。その後、2024年にプリンストン大学で計算論的神経科学の修士号を取得しました。彼女は、神経科学と機械学習からの洞察を応用して、実用的なブレイン・マシン・インターフェースを開発する方法を模索しています。

Luca Nunziante

シニアリサーチャー

ルカはアラヤのシニアリサーチャーです。カンパニア大学ルイジ・ヴァンヴィテッリ校で電子・コンピュータ工学の学士号を取得した後、2024年にローマのラ・サピエンツァ大学で人工知能とロボット工学の M.Sc を取得しました。修士課程在学中に東北大学宇宙ロボット研究室を訪問。研究テーマは、ロボット制御、人工知能、そしてその2つの交差点。

ARAYAの研究開発テーマ