ニュース
Toyota Research Institute ギル・プラット博士、蓼科で最新AIによる安全技術向上を語る 「いつの日かすべてのクルマにモリゾウのAI版を」
2024年9月18日 10:20
交通安全を祈る蓼科で行なわれたギル・プラット博士の講演
トヨタ自動車は9月17日~18日の2日間にわたって、 長野県茅野市北山蓼科にある聖光寺近辺を舞台に、トヨタの交通安全への取り組みについて説明を行なっている。聖光寺が舞台となっているのは、同寺が1970年に大きな社会問題となっていた交通事故の撲滅を祈願するため、トヨタ自動車(当時はトヨタ自動車販売)およびトヨタ自動車系列会社・トヨタ自動車販売店協会によって創建され、交通安全の寺として全国的にも知られているため。例年7月には交通安全夏季大法要などが行なわれ、トヨタ自動車関係者らとともに交通事故死者に対して慰霊が行なわれている。
そのプログラムの一つとして、トヨタの最先端AI研究を行なうToyota Research Institute CEO ギル・プラット博士(Dr.Gill Pratt)が来日。「Traffic Safety and the Meaning of Life(交通安全と人生の意義)」と題した講演が行なわれた。
ギル・プラット博士は、TRIをトヨタと共同で設立する以前はアメリカのDARPA(Defense Advanced Research Projects Agency:国防高等研究計画局)という先進的軍事技術を開発する政府機関でロボット開発の責任者として基礎研究を行なっており、自律で走るクルマによる「DARPA Grand Challenge」や「DARPA Urban Challenge」を主導した人とし知られており、現在のAIによる自動運転の流れを作り出した人でもある。
自動運転の世界では、自律自動運転による「Chauffer(運転手)/Series Autonomy」と、ドライバーアシストである「Guardian Angel(守護天使)/Parallel Autonomy」という考え方が語られることが多いが、その考え方をNVIDIAのGPU技術カンファレンス「GTC 2016」で世の中に問いかけ、混沌としていた自動運転開発の方向性を指し示した。その後の自動運転技術カンファレンスでは、Chauffer(ショーファー)やGuardian(ガーディアン)という考え方に基づいての研究発表が多くなり、現在に至っている。
ちなみに先進的軍事技術を開発するDARPAによって生み出された技術の一つが分散ネットワーク技術であるインターネットであり、その技術の巨大な社会的恩恵は説明するまでもない。
AI研究の方向性を指し示してきたギル・プラット博士が、交通安全の祈りの場である蓼科において、交通安全と人生の意義について語った。本記事では、その講演全文を掲載する。
ギル・プラット博士の語る「Traffic Safety and the Meaning of Life」
みなさん、こんにちは。今日は交通安全と人生の意義についてお話ししたいと思います。
トヨタには、問題の真因を探るために5回「なぜ?」を繰り返すという伝統があります。では、「人はなぜ生きるのか?(Why do we Live?)」という最も根本的な問いから始めましょう。
この問いに答えるのは非常に難しいです。なぜなら、私たちの人生は、空間的にも時間的にも極めて有限だからです。私たち一人ひとりは、宇宙空間にある何十億もの惑星の中の一つにすぎない地球上の、何十億もの人々のうちの、たった一人にすぎません。
そして、宇宙が存在してきた何十億年、そして将来も存在するであろう何十億年のうち、私たちが生きる時間は、通常100年にも満たないのです。
空間と時間における私たち一人ひとりの有限性を考えれば、私たちの人生に一体どのような意味があるのでしょうか?
その答えは、他者とのつながりの中にあります。
私たち個人としての人生は、装飾用の織物(タペストリー)の糸と糸が交わる小さな点のようなものかもしれません。しかし、空間と時間を超えて、私たちを結びつけるその縦糸と横糸こそが、私たちに生きがいを与えるのです。
この糸は、トヨタの歴史の中で大変深い意味を持っており、Woven Cityの象徴でもあります。
では次に、短い人生の中で、なぜ交通事故死はこれほど残酷なものなのでしょうか?
その答えを、私は数年前に蓼科山聖光寺の松久保秀胤住職から教わりました。
人が突然亡くなると、亡くなった方は他者とつながり何かを与える機会を奪われ、その方の愛していた方々は、別れを告げる機会さえも奪われるのです。突然の早すぎる死は、時空を超えてつながり合った人生の織物の中で、切れた糸となってしまうのです。
私自身も9歳の時、忘れられないつらい経験をしました。歩道を自転車で走っていた同級生が、高架のひび割れでコントロールを失って路上に出てしまい、自動車に衝突されて命を落としたのです。
54年前のあの出来事で私が最もよく覚えているのは、飛散した血のほかに、衝突のダメージの大きさにより、彼の履いていた小さな靴がはらい落とされていたことです。
そして、決してわるいことが起こるとは思っていなかったクルマの運転手が、頭を抱えてベンチに座り込み、泣き崩れていたことを覚えています。
この経験は、誰に責任があるかに関係なく、誰もが自動車事故で苦しんでいるということを教えてくれました。
こうした交通事故や死亡事故は減少し続けていると言いたいところですが、必ずしもそうではありません。日本の自動車事故による死者数は、数十年前のピーク時から大幅に減少していますが、年間2500人前後で横ばいとなり、高齢者ドライバーによる割合が不釣り合いに高く、社会の高齢化とともに増加の一途をたどっています。
私たちにできることは何でしょうか? トヨタは、「人・クルマ・インフラ」の3領域で改善が進めば、交通事故者数を大幅に減らすことができると考えています。
人々がより模範的なドライバーとなり、歩行時や自転車に乗る時に、より注意深くなれるよう指導していくこと。また、人がミスを犯したしても、事故を引き起こす可能性が低くなるように自動車を改良し続けること。そして、人とクルマがともに安全に移動できるよう、インフラを改善すること、この3領域に取り組んでいく必要があります。
これらの目標に向けた私たちの取り組みの中から、2つの例をお見せしたいと思います。
まずは、ロボティクス分野における驚くべき進歩をお見せし、それが自動車の予防安全にどのような影響を与えるかを説明します。
こちらの映像をご覧ください。何が起こっているのでしょうか?
ロボットがビニール袋のジッパーを開けています。何度か失敗を繰り返し、ようやく果実を移すことに成功しました。このロボット技術の何が驚きなのでしょうか?
このロボットの動作をプログラムするために、一体何行のコードが書かれたと思いますか?
答えはゼロです(The answer is zero. No Code at all)。
果物を入れた袋は透明で変形しやすいものであり、ロボットがフィードバックに使用したのはカメラのセットだけだったということも、非常に印象的です。
もう一つの例をご覧ください。今度はTシャツを折りたたみます。
もちろんこれもゼロコードです(with zero lines of code)。
どのようにしてこれらのタスクを実現しているのでしょうか?
ご覧のように、人間がロボットに、それぞれ微妙に異なる数十の例を示して教えているのです。
そして、生成AI(generative AI)を使って、これらの例を「大規模行動モデル」、つまりLBM(Large Behavior Models)に集約します。LBMはトヨタの革新的な技術で、ChatGPTのような大規模言語モデル、LLM(Large Language Models)の行動版と言えます。
結果として、多様な条件に対応できる強固な自律性が生まれたのです。
この映像では、マットは2つの異なる方向に巻き上げられ、異なるアームの使い方が求められます。ご覧のとおり、エラーにも対処します。
また、タスクを学習させるために、ロボットさえも必要ないことが分かってきました。私たちのスタンフォード大学のパートナーは、何台かのカメラを搭載するだけでよいことを証明しました。
そしてロボットは、ゼロ行のコードで、同様の行動を取ることを学習します。目標はケチャップを洗い流すことだと学習するのです。たとえ何度もやり直す必要があったとしても、きちんと水を止めます。
では、こうした技術が自動車の安全性向上にどう役立つのでしょうか?
私たちは現在、この技術をロボットから自動車に応用すべく取り組んでいます。ご覧いただいている映像は、数年前に私たちが開発したものです。
いわゆるオートノミー1.0(autonomy 1.0)と呼ばれ、障害物を避け、自動運転するクルマをプログラムするために、業界の誰もが使っていた、大資本を要し、データを大量に消費する手法です。
LBMという私たちの新しい手法は、オートノミー2.0の一例です。生成AIを使うことで、人間の能力に関する数少ない実演や、リアルな運転のシミュレーションを、より高水準の行動能力に集約することができるのです。
次に紹介するのは、自動運転に加えドライバーに適切な運転方法を指導することで、極端なハンドル操作が必要な場合でも衝突を回避することを目指す取り組みです。
今回お話しする緊急時のハンドル操作とはドリフトに関する技術です。なぜドリフトをすることが安全にとって重要なのでしょうか?
実は、現在のトラクションコントロールシステムは、この写真の真ん中にある台形の箱に示されているように、クルマの衝突を回避するための働きとしては十分ではありません。
しかし、クルマにドリフトをさせれば、ご覧の外側の線が示すように、衝突を避けるためにもっと多くのことができるようになります。ドリフトすることで、クルマは高速でも障害物との衝突を避けることができます。
過去には、静的な障害物を用いた衝突回避の方法を紹介しました。しかし、移動中の車両や障害物との衝突を避けるにはどうすればよいのでしょうか?
最近公開したこのビデオでは、2台のテストカーがそれぞれ自動運転でドリフトしています。1台目は高速で走行しながらも、難しい軌道を追うためにドリフトしています。
2台目のクルマは、1台目のクルマに追従しながら、刻々と変わる交通環境で衝突を避けるためにドリフトし、ぶつからないギリギリのレベルで追従走行を続けます。
そして、私たちがいつの日かすべてのクルマに搭載したいと思っている技術が、モリゾウのAI版です。この技術は、衝突を防ぐために、ガーディアンとして必要に応じてあなたに代わってモリゾウが車をドリフトさせるだけでなくまるで運転講師から指導を受けるように、AIの先生が、あなたによりよい運転方法を教えてくれるのです。
今回、数多くの研究の中から、2つの事例をご覧いただきました。
トヨタが、クルマと人の両方の状態をよりよくするために取り組んでいることを少しでもご理解いただけたなら幸いです。
そして、交通死亡事故の追悼の記憶を忘れないために、また、人々ができるだけ長く生きることができ、より多くの愛を表現する方法を見つけるために、私たちが取り組んでいることについて、少しでも共感いただけたならうれしく思います。
最後になりますが、初めに私が提示した「人はなぜ生きるのか?」という問いに立ち返ってみましょう。
その答えは、他者とのつながりがあるからです。
左の画像は、私が一緒に仕事をさせてもらっているToyota Research Instituteのメンバーとの写真です。右側は、私と息子、その姪(私の孫娘)との写真です。これらの画像が交通安全とどう関連しているのでしょうか?
それは、私たちの隣に貼られた安全標識の最後の3文字が物語っています。私たちはあなたを愛している(WE LOVE YOU)。
他者への愛は人生の根源的な意味であり、それこそが安全に配慮する理由でもあります。顧客への愛こそが、この分野における私たちの仕事の原動力であり、非常に重要な要素なのです。
以上です、ありがとうございました。
ギル・プラット博士が示した生成AIによる「LBM(Large Behavior Models、大規模行動モデル)」という新たな概念
今回の講演においてギル・プラット博士は、交通安全について「つながり」の大切さを語る。この気持ち(博士は愛と表現)が、安全にとって何よりも必要であるという。
それを支える技術の面では、生成AIによるLBMを提唱。現在よく知られている生成AIにはChatGPTなどがあるが、これはLLM(Large Language Models)によって構築されている。多くの文章を語句単位で分解し、語句同士のつながりを蓄積、そのつながりが蓄積されることで文章の読解が可能になり、質問に対して適切な回答を得られるようになる。
同様に、LBMではある動作を教えることによってロボットが学習。プログラムコードを記述することなく、ロボットが適切な動作をできるようになるという。動作について、日本では一般的なActionではなくBehaviorという言葉を用いていることについてギル・プラット博士に聞いてみたところ、「Actionは行動そのもの、Behaviorは行動に至るまでの一連の考えのリング」とのことだった。Behaviorは「振る舞い」とも訳されるが、認識や認知があり、その後に判断がある実行にいたるというプロセスがあることをBehaviorは示している。
TRIはこのLBMについて、ちょうど1年前となる2023年9月19日に発表しており、ロボットの実用性が大幅に向上する技術だという。
Toyota Research Institute Unveils Breakthrough in Teaching Robots New Behaviors - Toyota USA Newsroom
現在進行しているAIによる社会革命は、「ディープラーニングの父」とも呼ばれるヨシュア・ベンジオ(Yoshua Bengio)氏、ジェフリー・ヒントン(Geoffrey Hinton)氏、ヤン・ルカン(Yann LeCun)氏が生み出したAI技術を、NVIDIAのGPU技術が現実的な時間で実行可能にしたことから始まっている。2012年に登場したAlexNetが大きなインパクトとなり、2022年に登場した生成AIのチャットボットであるChatGPTで社会現象化。2023年からはそれらの生成AI技術がスマートフォンやPCに本格的に実装され始め、社会を変えていこうとしている。
LBMによるZEROコードでのロボットスキルセット獲得がどのようにクルマの自動運転に反映されていくかはこれからとなるが、一つの概念、一つの技術の登場が社会を変えていく。ギル・プラット博士の「Traffic Safety and the Meaning of Life」と題した講演は、GTC2016の講演以上のインパクトがあるものだった。