月惑星探査ロボットの経路計画についての研究をICRA 2023で発表します

Masafumi Endo
OMRON SINIC X (JP)
Published in
May 24, 2023

この度、慶應義塾大学からのインターンとしてOSXで取り組んだ月惑星探査ロボットの経路計画に関する研究がIEEE International Conference on Robotics and Automation (ICRA 2023)に採択されました。

Masafumi Endo, Tatsunori Taniai, Ryo Yonetani, and Genya Ishigami, “Risk-aware Path Planning via Probabilistic Fusion of Traversability Prediction for Planetary Rovers on Heterogeneous Terrains,” IEEE ICRA, 2023. [arXiv] [Project] [Code].

ICRAは、ロボティクスとその自動化技術に関する著名な国際会議の一つとして数えられています。本成果は、私の指導教員である石上玄也准教授との共著論文になります。

研究の背景

本研究では、月や火星などの天体表面で探査活動を行う車輪型移動ロボット(以下ローバ)のための経路計画問題について取り組みました。通信遅延により遠隔操作が困難な天体探査において、ローバには環境に潜在するリスクを適切に評価して目的地までの経路計画を行い、自律的にミッションを遂行する性能が求められます。(地球 — 月の場合およそ1秒、地球 — 火星の場合5分から20分、と遠方の天体になるにつれて通信遅延が大きくなり、人間による遠隔操縦は困難になります。)

NASAのパーサヴィアランスローバに代表されるように、ローバには一般に車輪型の移動機構が採用される。Courtesy NASA/JPL-Caltech

では月惑星探査における環境のリスクとは何なのでしょうか?自然地形に散在する岩石などの障害物(通れる、通れないという判断)に加えて、ローバは軟弱な不整地が引き起こす車輪のスリップを考慮する必要があります。過剰な車輪のスリップによりもたらされる走行不能(スタック)状態を避けるために、ローバがどれぐらいスリップの影響を受けることなく走行できるか、つまり走行可能性(traverse + ability = traversability)の評価が経路計画において重要となります。

NASAのオポチュニティローバが過剰なスリップを経験している様子。Courtesy NASA/JPL-Caltech

ここでは、走行可能性をスリップ率として定量的に示します。スリップ率はローバの実際の速度uと目標速度u_refの差異から以下のように計算されます。

正のスリップ率が生じている際、ローバは目標速度より遅く走行している状態でありs = 1となった場合ローバは走行不能状態に陥ります。反対に、負のスリップ率が生じている際、ローバは目標速度より早く(しかし不安定に)走行している状態となります。

この、スリップに起因する走行コスト(例:どの程度走行に時間を要するか)とスタックのリスクを考慮して経路計画を行うためには、与えられた環境情報からローバに生じうるスリップを予測し、経路計画時のコストマップを作成しなければなりません。では、砂粒の荒さなど地質の特性が異なる多様な地形が散在する天体表面において、ローバは如何にしてスリップを正確に予測するべきでしょうか?

異質な地形が散在する火星環境。Courtesy NASA/JPL-Caltech

究極的には考えうる全ての環境情報(地質や積もり具合など)を正確に調査することで、任意の位置でどの程度スリップが生じるかを知ることができます。しかしながら、未踏環境におけるこれらの環境情報を事前に取得して解析的にスリップをモデル化することは(現時点では)不可能です。一方で、視覚情報は遠方から特徴的な環境情報を大まかに捉えることができ、機械学習ベースのアプローチは視覚情報に基づく走行可能性予測において大きな効力を発揮します。これまで、特に地形の色情報と幾何(3次元位置)情報に基づいた以下のアプローチが走行可能性の予測に用いられてきました。

  • 分類モデルを用いて色情報(見た目)から大まかな地質の特性(地質クラス)を識別する地質分類
  • 回帰モデルを用いて地形の幾何情報(斜度)とスリップ率の傾向をモデル化するスリップ予測
地図データの色・幾何情報に基づく地質分類とスリップ予測。

天体探査における経路計画問題において、一般にピクセル毎に色情報と幾何情報が紐づけられた対象環境の地図データが与えられます。もし完璧なスリップ予測が可能であれば、プランナは正確なコストマップを活用でき、安全・効率的な経路を容易に探索できます。しかしながら、これらの学習ベースのアプローチには予測の誤りが不可避に存在し、誤ったスリップ予測の結果は最悪の場合ローバのスタックを引き起こします。本研究における問いは、経路計画におけるコストマップの構築において、機械学習モデルの予測誤りをどのように考慮するべきか?というものです。

提案手法

そこで本研究では、学習器の予測誤りを明示的に考慮した新たな経路計画手法を提案しました。ここで鍵となるアイデアは、分類・回帰モデルから得られる走行可能性の予測結果をその不確かさを考慮して確率的に融合させる、というものです。順を追って見ていきましょう。本研究では事前に訓練された以下の二種類の学習モデルから走行可能性を予測します。

  • 地形の色情報に基づきピクセル毎の地質クラスを予測する畳み込みニューラルネットワーク(convolutional neural network: CNN)
  • 地形の幾何(斜度)情報に基づき各地質クラスにおけるスリップの傾向をモデル化するガウス過程(Gaussian processes: GPs)

任意の地点においてまず、CNNからその地点の地形クラスの尤度を取得し、GPsからその地点での斜度における地質クラス毎のスリップの分布を予測します。そして地質クラスの尤度により重み付けされた各スリップ分布の総和を計算することで、混合ガウスモデル(mixtures of GPs: MGP)として分布・回帰モデルの予測結果を単一の確率分布へと統合します。

地質毎のスリップ分布の予測結果(上)と加重平均により統合された単一の確率分布(下)。

これにより、学習モデルの予測結果の確かさの度合いを考慮しながら複数地形が存在する可能性を包括したマルチモーダル(多峰的)なスリップ分布を予測することが可能になります。加えて、同分布は統計的指標(conditional value at risk: CVaR)を介してMGPの予測の範疇で生じうる、最悪のケースに近いスリップを効果的に評価することを可能にします。

CVaRを用いたMGPに対する保守的なスリップ予測。

上記のMGPとCVaRに基づくスリップ予測の結果をローバの速度へと変換し、走行時間を指標としたコストマップを活用することで、スリップが引き起こすスタックのリスクと効率への影響の双方を考慮した経路計画を行います。

天体模擬環境での評価実験

本研究では提案手法の性能評価のため、走行可能性推定の難易度が異なる以下の3つのデータセットを作成し、シミュレーション環境下で経路計画・追従を実施しました。

  • Standard (Std): 色情報と地形クラスが1対1で対応し、またガウス過程に基づく地質クラス毎のスリップモデルの不確かさが小さなデータセット。
  • Erroneous Slip (ES): ガウス過程により予測される、各地質クラスのスリップモデルの不確かさが大きなデータセット。十分な観測データを得られていない場合や、地形の堆積状況などの視覚情報では得られない細かな条件が学習ベースでの回帰を難しくなる状況を想定している。
  • Ambiguous Appearance (AA): 色情報と地質クラスが1対複数で対応し、正確な地質分類が困難なデータセット。見た目が同じにも関わらずスリップの傾向が大きく異なる地形が存在する場合や、ある地形の表面が別の地形に覆われている状況を想定している。
左から3次元で示される地図データ、色情報、地質クラスの正解ラベル、ガウス過程に基づくスリップモデルを示す。

また今回、プランナの比較検証のために分類・回帰モデルを決定論的に用いるアプローチ(single Gaussian processes: SGP [C. Cunningham et al., IEEE ICRA, 2017])や確率分布の期待値からスリップを予測するアプローチ(expected value: EV)を実装しました。

まず、経路計画・追従の結果を定性的にお見せします。経路追従時に経験するスリップの時間履歴から、MGPとCVaRからなる提案手法が既存手法と比較してよりスリップが生じにくい経路を計画していることが見て取れます。

異なるデータセット上での経路計画・追従結果。

定量的な実験ではローバの安全性・効率を次の指標から評価しました。

  • Succ.: ローバが100個中幾つのマップでスタックを経験することなく経路追従を実行できたかを0–100 [%]の値で示す、安全性の評価指標。
  • s_max: マップ毎に観測した経路追従時の最大スリップ率を示す、安全性の評価指標。値が低いほどより安全であることを表す。
  • T_total: 経路追従に要した走行時間を示す、効率の評価指標。

3種類のデータセットを用いた以下の経路計画結果が示す通り、提案手法が最善のSucc./s_maxスコアを達成し、学習モデルの予測誤りに対して頑健なナビゲーションを実現する経路計画を行っていることがわかります。加えて、T_totalのスコアより提案手法がスリップが生じにくい経路を探索することで走行時間に対する効率を維持していることがわかります。

各データセットにおける定量的な経路計画結果。

まとめ

  • 本研究では複数地形が散在する天体表面でのローバの自律移動を目的とした、スリップ予測の誤りを明示的に考慮した新たな経路計画手法を提案しました。
  • 学習モデルの予測結果の確かさの度合いを考慮しながら多様な地形が存在する可能性を包括したマルチモーダルなスリップ予測を可能とする、確率的な学習モデルの統合を提案しました。
  • 画像情報が地形の特徴を十分に捉えていない場合や、スリップモデルの予測誤差が大きい場合など、実際の天体探査で起こりうる状況を模擬したデータセットを用いて提案手法の評価実験を行い、既存手法を上回る安全なナビゲーションを行うことを実証しました。

さらなる情報

  • 論文では提案手法のより詳細な説明を記載しております。
  • プロジェクトサイトではビデオプレゼンテーションやコードなども公開しております。
  • ICRAでのオンサイトでの質問やコードリポジトリ上での質問などお待ちしております。

--

--