IROS’20にロボットナビゲーションに関する論文が採録されました
OMRON SINIC X リサーチエンジニアの西村です.
弊社で取り組んでいる群衆環境下でのロボットナビゲーションに関する研究が International Conference on Intelligent Robot and Systems (IROS,2020) に採録されました.
Mai Nishimura and Ryo Yonetani, L2B: Learning to Balance the Safety-Efficiency Trade-off in Interactive Crowd-aware Robot Navigation, [arXiv][project page]
オムロンサイニックエックスでは実社会で人々と協調・共存して活動する移動ロボットの実現を目指し、動的で混雑した環境下においても適用可能な経路計画技術についての基礎研究を進めています。駅構内や商業施設、大規模な展示会場など人の往来がある通路を動き回ることができるロボットは、警備、案内、搬送など様々な応用での活躍が期待されています。
動的環境下における経路計画の課題
移動ロボットにおける経路計画では、周辺環境の地図情報を用いてロボットにとって安全かつ最短な経路を算出します。しかしながら、雑踏のような動的・複雑な環境において既存技術を用いた場合、ロボットが安全な経路を見つけることができず停止してしまったり、周囲との衝突を回避しようと迂回路を取り続けることによって目的地へ到達できなくなる問題がありました(図1)。
環境への介入行動を含めた行動選択
そこで本研究では、経路計画において衝突回避だけではなく、警告音を発して道を空けて貰うといった環境への介入行動を適応的に選択するための新たな深層強化学習手法を提案しました。シミュレーション実験の結果、提案手法を用いて学習されたエージェントは、状況に応じて介入行動により経路を自ら作り出し、既存手法を用いた場合より安定して目的地に到達できることが明らかになりました(図2)。
行動選択のジレンマ
安全を重視して常に衝突回避を行うと、目的地までの走行距離が非常に長くなってしまう一方で、短期的な効率を重視して常に介入を行うと、群衆の自然な移動経路が妨げられさらなる混雑を引き起こしてしまいます。提案手法では、このような安全性と効率性の間にあるトレードオフを組み込んだ報酬関数を設計しました。これにより、群衆密度などの環境パラメータに応じて適切な介入頻度を学習し、安全性と効率性のバランスを保った方策の獲得を実現しました。
おわりに
我々人間は集団の中で移動する際に、安全な経路を選択するだけでなく、状況に応じて様々な知的判断を行っていると考えられます。本研究では移動ロボットの経路計画を、環境への介入を含めたより広い枠組みでの意思決定問題として捉え、周囲と協調して目的地に到達するエージェントの訓練方法を示しました。本研究成果は、人が介在する様々なシーンでの行動計画や、複数ロボットの制御、ゲーム理論を応用したより複雑な意思決定などへの発展が期待されます。
オムロンサイニックエックスでは人・ロボットが共生する新たな社会の実現を目指し、今後も基礎技術の研究開発を進めて参ります。
脚注
[*] Our demo results utilized the pedestrian model by mixamo.com and the robot model by Tomás Laulhé, modifications by Don McCurdy. CC0 1.0.
Post based on:
Mai Nishimura and Ryo Yonetani, L2B: Learning to Balance the Safety-Efficiency Trade-off in Interactive Crowd-aware Robot Navigation, In Proc. IROS, 2020. [arXiv][site]
Relevant Project:
Hiroaki Minoura, Ryo Yonetani, Mai Nishimura, and Yoshitaka Ushiku, Crowd Density Forecasting by Modeling Patch-based Dynamics [arXiv]