自動運転車両を実現するスマートなAIへの道

さまざまなコンピューターサイエンス企業、大手テクノロジー企業、世 界中の自動車メーカーが、機械学習 (ML) を使用して完全な自動運 転車両を実現する次世代の人工知能 (AI) を開発しようとしのぎを 削っています。

メルセデス・ベンツ、BMW、レクサス、テスラなどの高級車メーカーや、Google、Microsoftなどのハイテク企業は、都市環境でSAEレベル3までの自動運転エクスペリエンスを提供できる洗練された先進運転支援システム (ADAS) を保有しています。こうしたシステムはすべて、 限られた条件下においてある程度の状況に対応しますが、負担の多い状況や事故が差し迫った場合には、依然として人的な介入が必要です。

2019年春にEU運輸担当委員ビオレタ・ブルツ氏は、2030年までに完全な自動運転機能が実現すると予想しています¹。しかし一方で、欧州道路交通研究諮問会議は、自動運転機能の実現を2030年以降になると予測しています²

完全な自律性 (車両が地域や条件を問わず運転できる状態) を実現するには、AIのアプローチを次のレベルに進める必要があります。これにより運転エージェントは、未知または予測不可能な状況におけるドライビングポリシーを最適化するために熟練運転者の対応情報を収集し、人間の運転行動を実装するようになります。これには膨大な量のデータが必要であるため、データエンジニアはシステムがより優れたドライビングストラテジーを立てるうえで役立たない、不用なデータの処理を排除する手段を見つけなければなりません。

事故の減少と持続可能性の向上を約束する真に安全で安心できる自動運転を実現するため、自動運転車両は無関係のデータを排除し、常に運転の意思決定を人間よりも速く確実に行う必要があります。道路インフラのスマート化は、必要なデータのみを配信することでこの問題に対処しようとするものですが、真の自動運転車両の発展を妨げる依存関係も生み出します。今後のデータ、コンピューティング、AIにまつわる課題は極めて困難です。

しかし、自動運転車両は命を救う大きな可能性を秘めており、そのメリットは絶大です。米国運輸省道路交通安全局 (NHTSA) は、重大な自動車事故の94%が人為的ミスによるものであるという重大な事実に基づき、自動運転車両が負傷者を減らせると主張しています³。自動運転車両は、事故の諸要因から人為的ミスの大部分を解消することを約束し、運転手や乗客だけでなく、自転車や歩行者の保護を促進します。

現状を打開

現在、米国の約半数の州で公道での自動運転車両の試験走行が行われており、大規模な実験が進行していると言えます4。試験走行のほとんどは、アリゾナ州、カリフォルニア州、ジョージア州、ミシガン州、ネバダ州、テキサス州、ペンシルベニア州、ワシントン州で行われており、特に最も盛んなカリフォルニア州では52社が自動運転車両の試験走行を実施しています。

AIへの新しいアプローチは、基本となる自動運転プラットフォームから始まります。自動運転プラットフォームにより、エンジニアはドライバーの運転行動に関する知識を確立し、これらの情報を精緻化して実際の状況でインテリジェントな運転エージェント (自動運転車両) がどのように反応するかをシミュレートすることができます。このプロセスにより、エンジニアはインテリジェントな運転エージェントが、人間が学習するのと同様に徐々に運転行動を学習し、運転機能を構築し、その情報を呼び出せるように支援することが可能になります。

学習するAI運転エージェントの開発

今日、コンピューター科学者は、AIとMLの導入でさまざまなタイプのアプローチ、アーキテクチャー、トレーニング戦略を試みており、これらはすべて今後10~20年にわたって自動運転車両の開発に役立つでしょう。自動運転エージェントの学習に関連する主なAI/ML理論を次に紹介します。 

1. 脳科学 より優れたAI運転エージェントを構築できる可能性のあるアプローチの1つは、ドイツのフランクフルト高等研究所 (FIAS) のダンコ・ニコリッチ氏が行う脳科学研究からインスピレーションを得ています。ニコリッチ氏は、「プラクトポイエーシス (Practopoiesis)」5 において、人間が実際には3段階で学習するという理論を立てています。これは、試行錯誤 (進化を通じた知識の蓄積)、学習方法の学習、そして最後に、知識を行動に移す、という段階です。ニコリッチ氏がAIを自動運転に適用するうえで最も重要であると考えるのは、人間が「学習方法を学習する」という第2段階です。人間がどのように学習するかについて研究が進めば、自動運転車両や一般的な教育への適用に おいて、AIの可能性はますます広がります。ニコリッチ氏の理論では、AIテクノロジーに 人間の学習方法を学ぶように教える必要があると主張されています。

この理論を自動車分野のAIに適応させるには、まず人間の学習方法を学習できる運転学習エージェントを構築し、その後に人間のドライバーの行動から短期間で習得できる学習者トレーニングセットを作成します。革新的な脳研究をAIと完全な自動運転車両の開発に適応させるという概念は、過去数年で大きく期待される技術革新の1つとして浮上しました。時間はかかるものの、自動運転車の開発だけでなく、それと同時に脳の機能について知識が深まることによる社会的利益は、人間の進歩にとって大きな可能性を秘めています。

脳科学のアプローチは人間の学習を最大限に活用し、自動車分野に最高のAI運転エージェントを開発できる可能性をもたらしますが、研究には数年かかる可能性があり、自動運転車両の生産に適応させることは困難です。

2. 模倣学習 このタイプのアプローチでは、AI学習者はまず、運転熟練者 (多くの場合は人間) の行動を教師あり学習を通して観察し、次に最高のパフォーマンスを達成するためにこのトレーニングセットを使用して熟練者の行動を模倣する際の指針を学習します。たとえば、AI模倣学習エージェントは人間の熟練ドライバーを観察し、ドライバーが右や左に曲がったり、一時停止標識で停止したり、広い幹線道路で加速したりする様子を観察しながらドライバーの行動を経時的に記録していきます。この追跡結果に基づいて、学習エージェントは熟練者の行動を基に特定の状況に対して実行すべき行動の指針を作成します。ランタイムテストでは、学習エージェントは作成した指針に基づいて最適な行動を計算します。時間の経過とともに積み重ねられた経験に基づいて、システムは最適なケースのネットワークを開発し、特定の推論における決定論的なポリシーモデルに基づいて常に理論的に最適な選択をします。

模倣学習は教師あり学習の利点を活用することで、ある重要な問題に取り組んでいます。これはつまり、運転エージェントがこれまでに対処したことのない想定外の状況において、安全性を維持するという大原則を守りながら対処できるように、どのように熟練者の運転状況を収集し操作ミスを総括するかという問題です。この問題を克服することは可能ですが、高度な自動運転テクノロジーと熟練した技術者が一丸となったチーム、そして多くの時間が必要です。

3. 強化学習 このタイプの学習は、熟練者や人間などが存在せず、教師なし学習として行われます。エージェントには報酬機能が割り当てられ、各種の戦略を使用して、道路上のさまざまな状況と行動を効果的に探索します。試行錯誤を経て、エージェントは最適な指針を探し出します。強化学習では、エージェントの行動に対する報酬を最大化することを目指します。モデル推論に基づく運転モードでは、強化学習エージェントはすべてのイベントに対して自身のモデルを適用し、問題なく通過します。

ただし、試験中にシミュレーション内で車が衝突したり、歩行者や他の車に衝突した場合、タスクは負の報酬で終了します。次に、エージェントはランダムな行動から開始し、試行錯誤を通じて、どの行動が報酬を最大化し、どの行動が正の最大スコアをもたらすかを学習します。強化学習がうまく機能している場合、車が木に衝突すると、その衝突を二度と起こさないように学習し、その間違いを繰り返さないようにします。強化学習の主な課題は、行動の安定性が低いことと、環境の規模とコンピューターの処理能力に大きく依存することです。

破滅的忘却の回避

ニューラルネットワークは人間の脳に似た動作をするように設計されたコンピューターシステムですが、人工的なものであっても忘れないわけではありません。破滅的忘却とは、ニューラルネットワークが新しい対応を追加で1つ訓練されるたびに、以前に学習した運転知識を破滅的に損失してしまうことを指します。破滅的忘却の理論によれば、アーキテクチャーによってはエージェントのニューラルネットワークは少数のシナリオしか実行できず、パフォーマンスが急速に低下します。

現在、ニューラルネットワークにさらに多くのテストシナリオを追加すると特定のしきい値で頭打ちとなります。現時点のアプリケーションでは、運転行動エージェントにシナリオ分類子の入力と前提条件を追加する方法以外にこの問題を解決する方法は誰にもまったく分かりません。ただし、確率論によると、この方法は精度を低下させます。

現在、米国と中国でこの課題に取り組む研究が行われていますが、この破滅的忘却の問題が克服されるまで、統合された単一の行動モデルで完全な自動運転に対応することはできません。破滅的忘却を回避する方法についての研究は始まっていますが、エンドツーエンドのシナリオを無制限でトレーニングして管理できるまでに能力を高める決定的な手法はありません。これはとても重要です。ニューラルネットワークが以前の経験に基づいて学習したことを忘れる場合、自動運転車両は既存のルールに応じたプログラミングモデルに従い続ける必要があり、完全な自律性に到達することはありません。

破滅的忘却を解決することにより、可能な限り最高レベルの完全な自動運転に到達することが約束されます。しかし、AI運転エージェントが抱える特定のしきい値の問題を乗り超えることは非常に複雑で困難です。

実現は間近

業界の有識者ウォッチャーは、これらのAIのアプローチのうちどのアプローチが長期的に主流になるのかを頻繁に検討しており、おそらく今後20年間で4つのアプローチすべての一部が利用されるはずです。運転行動データを扱うエンジニアや、コンピューター科学者、AI科学者・研究者は、完全な自動運転を開発するための適切な設計、さらには新しいAIのアプローチを見つけ出す必要があります。ただし、今後さらに試験を重ねるにつれて、学習方法の習得についてと、習得した知識を一般化して発展させる方法について多くのことがわかるでしょう。

自動運転行動を次のレベルに進めるためには、データと処理の問題が非常に重大であり、私たちは人間の知能のすべてに取り組むことはできません。人類はこれらのすべてのデータを収集して保持できるストレージ設備をまだ創り出せていませんが、コンピューター科学者と業界の研究者が自動運転のためのAIエージェントに力を注ぎ続ければ、これらの課題の多くを克服することが可能になり、近い将来により高いレベルの自動運転機能を提供する最初の完全な自動運転車両が登場するでしょう。

こうしたすべての新しい自動運転テクノロジーは、コンピューティング、データレイク、統合セキュリティ、完全に管理された開発セキュリティ運用 (DevSecOps)、メタデータの管理とガバナンス、高性能ネットワークを含む、バックエンドの自動運転プラットフォームで開発されます。 拡張AIシステムはすべて、数千ではないにしても数百ペタバイトのデータと、少なくとも数千のグラフィック処理ユニット (GPU) を扱う必要があります。コンピューター業界は、これらのデータストレージと処理パフォーマンスのニーズの多くに対応し始めています。

今後も大型で高速なコンピューターの開発は続きますが、AIのパワーを習得し、自動運転に適用するまでには、自動車コンピューター科学のエンジニアが何十年も忙しい状態が続くでしょう。これは、私たち世代の大きな挑戦の一つです。