特に強化学習に重点を置き、AIの基礎と応用の両方の研究に取り組んでいます。強化学習は不確実性の下での逐次的な意思決定の研究であるため、ロボット操作や複数の目標に基づくエージェントの調整など、多くの問題を包含しています。私たちの目標は、生物学的および人工知能の理解を深め、これらの洞察を用いて、実世界の複雑なタスクに適用可能なAIシステムを開発することです。

KEY WORDS
#ディープラーニング
#強化学習
#模倣学習
#進化的計算
#人工生命

Highlights

Brain-Computer Interface Robot Control

ブレイン・コンピュータ・インターフェイス(BCI)は、人間の神経信号とコンピュータを直接つなぐことで、神経・生理障害を持つ人間が、通常では不可能な方法で世界と相互作用できるようにするものです。しかし、BCIの入力は、高度な信号処理と機械学習技術を必要とし、扱いが難しい。BCIとロボットを自律性の共有というパラダイムで結びつけば、ユーザーは物理的に世界と対話することができるようになります。残念ながら、(制約の多い工場環境以外の)実世界でロボットを操作することは難しく、人工知能や制御理論におけるさらなる最先端の手法が必要である。私たちは現在、より汎用性の高いBCIロボット制御を実現するために、これらの分野の研究を統合・発展させるべく取り組んでいます。

Benchmarking Imitation Learning

ここ数年、多くの研究者が模倣学習法を開発しており、それぞれが様々なタスクで最先端の性能を発揮しています。しかし、データの前処理やハイパーパラメータの調整、あるいは単に計算量の増加など、ある手法の主張する貢献度以外の要因によって結果が容易に左右されることがあります。A Pragmatic Look at Deep Imitation Learningでは、多くの手法の貢献度を分解し、模倣学習手法の統一的なフレームワークを開発し、アルゴリズム間の公正な比較を行うことができるようにしました。また、他の研究者が模倣学習法を研究したり応用したりするための open source library も公開しました。

Procedural Content Generation for Space Engineers

多くのビデオゲームでは、大量のゲームコンテンツを(半)自律的に作成するために、プロシージャルコンテンツ生成(PCG)を利用しています。乗り物のようなアセットでは、生成されるコンテンツは機能的であると同時に美的感覚に優れたものでなければならない。さらに、デザイナー、あるいはプレイヤーは、通常、さまざまなオプションから選択することを望みます。Space Engineersの3Dサンドボックスゲームでは、これを実現するために、進化計算のテクニックを組み合わせて使用しています。Evolving Spaceships with a Hybrid L-system Constrained Optimisation Evolutionary Algorithmでは、面白くて機能的な宇宙船を生成するための新しいハイブリッド進化的アルゴリズムを開発しました。その後、「Surrogate Infeasible Fitness Acquirement FI-2Pop for Procedural Content Generation」において、新しいフィットネス関数を開発し、さらにそれをよく知られたMAP-Elitesの「品質多様性」アルゴリズムに適用して、これを改良した。

Members

Kai Arulkumaran, Ph.D.
チームリーダー
チームリーダー。Imperial College Londonの客員研究員も務める。2012年にケンブリッジ大学でコンピュータサイエンスの学士号を取得し、2020年にインペリアル・カレッジ・ロンドンでバイオエンジニアリングの博士号を取得した。これまでDeepMind、Microsoft Research、Facebook AI Research、Twitter、NNAISENSEで勤務。研究テーマは、深層学習、強化学習、進化的計算、理論的神経科学。
Manuel Baltieri, Ph.D.
チーフリサーチャー
Arayaの主任研究員、サセックス大学の客員研究員。トレント大学でコンピュータ工学と経営学の学士号を取得後、サセックス大学で進化・適応システムの修士号とコンピュータ科学とAIの博士号を取得。その後、日本学術振興会・英国王立協会特別研究員を経て、2021年末にアラヤに入社するまで、理化学研究所CBSの神経計算・適応研究室で豊泉太郎と共同研究を行う。研究テーマは、人工知能・人工生命、エージェンシーと個性の理論、生命の起源、身体化認知、意思決定など。
小川 弾
チーフリサーチャー
アラヤの主任研究員。2015年にスウェーデン王立工科大学で工学物理学の学士号を、2018年にロボティクスの修士号を取得。以前はTelexistence Inc.に勤務し、産総研の研究員も務めた。主な研究テーマは、機械学習とロボティクスの交差点であるロボティクス学習。
ルスラン・ドーサ(Ph.D.
シニアリサーチャー
ルスラン(Rousslan)アラヤのシニアリサーチャー。2023年に神戸大学で博士号を取得。自己教師付き学習を中心とした深層強化学習、人間の認知に触発された意思決定、神経科学、進化コンピューティングのトピックにまたがる研究を行っています。
シヴァカント・スジット
シニアリサーチャー
シヴァカントはアラヤの上級研究員。2023年にミラ・ケベックでサミラ・エブラヒミ・カホウ教授のもとで修士号を取得。ロボット工学とLLMのための深層強化学習に興味がある。Milaに入社する以前は、インドのNIT Trichyで制御工学の学士課程を修了し、このバックグラウンドが、実世界で安全に相互作用できるエージェントを構築するために、制御理論とRLからの洞察を組み合わせる研究の原動力となっている。
秋山 祥伍
シニアリサーチャー
祥吾は、アラヤのシニアリサーチャーです。2019年にコンピュータサイエンスのB.S.を取得。以前はAIやWebアプリケーションのエンジニアとして働いていた。研究テーマは強化学習と自然言語処理。
マリーナ・ディ・ヴィンチェンツォ
シニアリサーチャー
MarinaはArayaのシニアリサーチャーです。2017年にウルビーノ大学「カルロ・ボー」で心理学の学士号を、2021年にローマ大学「ラ・サピエンツァ」で神経科学と心理リハビリテーションの修士号を、同年、国家研究会議認知科学技術研究所(ISTC-CNR)で人工知能のディプロマを取得。 研究テーマは「神経技術支援におけるユーザー中心設計」。