CES 2017

【インタビュー】AI自動運転時代の鍵を握る、NVIDIA CEO ジェンスン・フアン氏に聞く

「AIカーを実現できるソリューションを提供済み、他社に数年先行している」

NVIDIA CEO ジェンスン・フアン氏。自動運転が注目を集める「CES 2017」において、一番最初に行なわれる基調講演を担当した

 2017年のCESで大きなテーマとなっていることが3つある。1つ目が自動運転、2つ目がAI(Artificial Intelligence、人工知能)、そして次世代携帯電話回線の規格となる5G(第5世代携帯電話)がそれだ。そうした3つのテーマのうち、最初の2つに密接に関わっているのが半導体メーカーのNVIDIAだ。

 自動運転にも使われているAIに必要とされる、マシンラーニング、ディープラーニングというコンピュータ演算に、同社のGPUが演算装置として使われているからだ。そうしたこともあり、NVIDIA CEOのジェンスン・フアン氏がCESの基調講演において最も格式が高い、開幕前日の夜に行なわれたキックオフ基調講演に登壇し、同社の戦略について説明した(自動運転に関しては、Car Watchの記事「自動運転技術で『10兆ドルの産業に革命を起こす』」を、コンピュータ向けおよび家庭向けのAIの内容に関しては僚誌PC Watchの記事「“OK Google”で家電と連携可能な未来を垣間見せるNVIDIAの新SHIELD」を参照いただきたい)。

 フアン氏は基調講演の翌日に、報道関係者からの質疑応答に応じ「自動運転を実現するまでに、自動車メーカーは多数の課題を抱えている。NVIDIAはGPUを利用したソリューションを提供することでその実現を助けていきたい」と述べ、GPUを利用した同社のAIカープラットフォームを自動車メーカーに提供していくことで、AIを利用した自動運転車を実現していきたいと説明した。また、フアン氏は「ほかの企業もこの市場に参入しつつあるが、実際に製品化を実現するにはあと数年かかるだろう」と述べ、NVIDIAがAIを活用した自動車を実現するソリューションで数年先を行っているという自信を示した。

自動運転を実現するために自動車メーカーが抱える課題を解決したい、すでにソリューションを提供している

──:(NVIDIA司会)では冒頭に弊社CEOから挨拶を……

フアン氏:昨日行なわれた基調講演では、ゲーミングPC、家庭でのAI、そしてAIを利用した自動運転について話をした。PCゲーミング(PCアーキテクチャを利用したゲーム機のこと)はグローバルなトレンドになりつつあり、今やゲーミングのセンターはPCになりつつあり、ユーザーはPCを必要としている。すべての人はゲーマーであるのが今の世界で、今後もPCゲーミングは非常に早く成長するだろう。例えば、人気のタイトルの「Call of Duty」に必要な描画/演算性能は10倍以上になっている。それに4K、VR、HDRという新しい技術が加わっていき、今後もテクノロジーが市場をドライブしていくだろう。

 そして今は、ゲーミングは単なるゲームではない。スポーツの1つになりつつある。それをTwitchは言うまでもなく、YouTubeでもゲーム投稿が増えており、ゲーミングはプレイするだけでなく、見るコンテンツとしても成長している。そうしたeスポーツのベストプラットフォームはPCだ。

 家庭向けAIでは、ホームコンピュータについて話をした。PCはどこまで行ってもパーソナルコンピュータであって、家族が共有するようなコンピュータではない。ではホームコンピュータとは何か、それを我々が形にしたのがShieldだ。

 自動運転の観点では、自動車にコンピュータを搭載すればいいということではない。AIはプラットフォームであり、知覚を担当したり、判断を行なったり、運転そのものを行なったりする。

 話を、PCゲーミングに戻すと、今回のCESでは30を越えるゲーミングPCが登場した。我々は、GeForce GTX 1050 Ti/1050を発表し、それはPlayStation 4よりも優れた性能を実現している。また、4Kの解像度で、G-Sync/HDRの機能を実現したモニタがASUSやAcerから登場し、画面の遅れや揺れがなくゲームをこなすことができる。

──AIを利用した自動運転はいつ可能になるのか?

フアン氏:非常に答えるのが難しい質問だ。プラットフォームの準備は整いつつある。人間との特異点の境界を越えたAIがすでにあり、顔認識、リップシンクもすでに可能である。カメラですべてを見ることができる。しかし、もっともっとコンピューティングパワーが必要だ。それを実現するのがXavier(エグゼビア)だ。

フアン氏は1月4日の夕方に行なわれた基調講演でXavier(エグゼビア)を公開した

──音声認識とリップシンク両方が必要なのか?

フアン氏:そうだ。例えば窓が壊れて騒音が大きなときを考えてみればいい。そうなると、騒音が激しくなり、音声認識は難しくなる。リップシンクであれば騒音が大きくても認識が可能だ。

──現在多くの半導体メーカーがAIに参入している。例えば、IntelはBMWと組んで彼等のAIソリューションを採用した自動運転車を開発している。そうした中でのNVIDIAの強みは何か?

フアン氏:NVIDIAは非常に長い期間自動車ビジネスに取り組んできたし、AIに関しても他社に先駆けて取り組んできた。実際、このビジネスを始めたときには売り上げはほとんどゼロだった。それでも自動車メーカーと一緒にビジネスをしていくことが大事だと考えて取り組んできた。確かにおっしゃるとおり、市場が大きくなってきたので、競合メーカーが増えてきた。しかし、実際に実現できているところは多くない。それに対して我々のDRIVE PXはすでに動いている。ほかのメーカーが実際に動作する製品を出せるようになるにはあと数年はかかるだろう。

──AIを実現するにはディープラーニング、マシーンラーニングで読み込ませるビッグデータが必要になる。しかしそれらはGoogleなどの巨大企業しか持っていない。スタートアップはAIでビジネスをするのは難しいのか?

フアン氏:確かにデータは新しい“石油”であるという人は少なくない。確かに巨大企業は彼等のクラウドに多くのユーザーデータを抱えており、それが彼等のビジネスを優位にしていることは否定できない。しかし、必ずしもそうした巨大企業だけがビッグデータを持っているという訳ではない。例えばNVIDIAの場合は20年以上に渡り半導体を製造してきたので、半導体のデータに関して非常に巨大なデータをもっている。また、よりパブリックなデータということで考えれば、自治体などが公表している天候のデータなどもビックデータの1つだろう。そうしたものを利用していけば、アイディア次第で巨大企業に対抗できるものを作っていけるのではないだろうか。

──NVIDIAはどうしてAIなどを他社に先駆けて実現することができたのか?

フアン氏:弊社では多くのエンジニアがAIのために働いている。そのベースになっているのがGPUだ。GPUは始めはビジュアルコンピューティングとして発展したが、その後GPUコンピューティングとして一般的な用途に利用されてきた。それらが相互に影響し合って発展し、ゲーミング、VR、HPC、AI、自動運転……いろいろなことを実現できている。

──米国ではテスラモーターズの事故が大きな話題になった、それについてどう思うか?

フアン氏:非常に不幸な事で悲しむべきことだ。テクノロジーがもっともっと進化しなければ成らないことを明白だ。我々が研究開発に多額の投資を行なっているのはそのためだ。AIの抱える課題を解決するのは、簡単ではないが、だからこそよりハードワークを続けていく必要がある。

──人間はAIが運転する自動車を共有するだろうか? やはり自分が運転したいと思うのでは?

フアン氏:ドライバーはすべての状況をコントロールできる。交通は非常に大きな仕組みだ。それは産業界にとってだけでなく、社会にとってもだ。交通は進化していく。自動車は非常にロマンティックな存在だ。我々はクルマを愛している。多くの人がクルマとの距離感を間違えたり、使い方を理解できなかったりということはない。毎日クルマを運転して家と会社の間を往復している。私もモデルSをドライブしている、毎日クルマは進化しており、毎日より安全な存在になりつつある。

──ドライバーアシストと自動運転、どちらの方が有益なのか?

フアン氏:基調講演でもお話ししたように、自動運転こそ自動車の未来だと私は信じている。ドライブするときには、クルマに対して今日のプランを伝えるだけでよい。自動車に搭載されているコンピュータがインターネットに接続されて情報を取得し、詳細をコンピュータが調べて決める。すべてが自動で行なわれる。AIカーというのは非常に壮大なコンセプトで、AIカーには2つの大きな機能がある。1つはユーザーのためにドライブをすることで、もう1つがドライバーの代わりに周囲の状況を把握してくれることだ。このアイディアを実行すれば、確実に明日はよりよい社会になるはずだ。

──NVIDIAは自動車産業でどんな存在になりたいのか? プラットフォーマーになりたいのか、ティア1になりたのか?

フアン氏:自動車メーカーが抱える問題を解決したい、それだけだ。そのためのソリューションを提供する、それが弊社の役割だ。実際、世界中には多くの自動車メーカーがあり、多くの自動車関連のサービスがある。それぞれに異なるタイプがあり、1つのソリューションだけですべてを解決できる訳ではない。ただ、AIはコンピューティングのプラットフォームそのものであるので、プラットフォームとして自動車メーカーに提供していく。

基調講演ではティア1の部品メーカーであるボッシュやZFとの提携。アウディとAIカーにおける提携が発表された

自動車にもAIアシスタント機能は搭載されていく、Shieldはホームコンピュータ

──基調講演ではGoogle Assistantの採用を明らかにしたが?

フアン氏:2つのピースがある。非常に難しい音声認識と文脈認識、そして自然言語認識だ。人間の話というのは、以前に話したことと文脈レベルでつながっていて、それを理解するというのはコンピュータにとって非常に複雑な作業だ。それをGoogle Assistantは実現している。またバックエンドでは強力なサーチエンジンが必要になる、Googleのサーチエンジンが優れているのは誰もが理解している。こうしたアシスタント機能は、将来はいくつかのプラットフォームに集約されていくだろう。

──新しいShieldはどのような製品か?

フアン氏:Shieldは家庭向けのコンピュータだと考えている。我々の生活にはPCがあるじゃないかというかもしれないが、PCはどこまでいっても個人向けであり、家庭向けではない。自動車もコンピュータが必要になっているように、家庭にもそれに最適なコンピュータが必要になる。重要なことは、Android TVはインターネットを経由してクラウドに接続されており、そこで動いているAIを利用可能にしている。それが重要なことだ。

NVIDIAが基調講演で公開した新しいShield。音声認識を利用した家庭向けのAIを提供する

──なぜShieldは据え置き型なのか?

フアン氏:情報を見るには何らかのモニタが必要だ。ホームコンピュータはどこに接続されるべきかと考えたときに、家庭で一番大きなディスプレイは(据え置き型の)TVだ。

──基調講演ではクラウドベースのゲーミングとなるGeForce Nowを発表した。今後もそうしたクラウドベースのGPUの利用は高まっていくのか?

フアン氏:そのとおりだ。Amazonも、Microsoftも、GoogleもみなGPUの演算性能を提供するクラウドサービスを提供している。ソフトウェアをホストすればGPUをより簡単に利用できる世界がすでに実現されている。

──Shieldのオプションとして用意されるSPOTは常に音声を拾っているが、プライバシーの問題はないのか?

フアン氏:強く強調しておきたいのは、我々はデータを収集することは興味がないということだ。SPOTは家庭内のあちこちにおいて、場合によっては壁に埋め込んだりもできる。ユーザーの意志に従ってShieldで音声認識をしたときだけ、データを入手し検索したりする。

Shield向けのマイクオプションとなるSPOT

──Shieldは任天堂Switchとの競合はないのか?

フアン氏:任天堂Switchはゲームコンソールで、任天堂の素晴らしい製品だ。彼等は彼等の文化で、そして彼等のビジョンで素晴らしい製品を作っている。ゲーム体験をよりよく、安全で、面白い体験を子供や若者にもたらすための製品だ。ただ、SwitchはAIにフォーカスしていないし、競合していないと思う。

──自動車のAIもGoogle Assistantになっていくのか?

フアン氏:現在クラウドベースのAIにはさまざまな選択肢がある。IBM Watson、Microsoft Cortana、Google Assistantなど選択肢があり、自動車もそこにつながっていくだろう。それにより自然言語を理解できるようになるなどのメリットがもたらされる。我々が目指しているのは、OEMメーカーが自分が使いたいサービスを選択し、それをよりよく利用できるソフトウェア環境を提供していくということだ。

──NVIDIAの競合はディープラーニングやマシンラーニングのため、固定機能をもった半導体の計画をもっている。NVIDIAはそうしたカスタムチップを用意する予定はないのか?

フアン氏:GPUはそもそもカスタムチップそのものだ。我々のPascalはディープラーニングのためのアーキテクチャ変更であり、GPUをディープラーニングにカスタム化したものだ。

──クラウドのAIでは、クラウド側の演算性能が強化され、クライアント側(エッジ側)はあまり性能が強化されないようになるという意見もあるようだが、NVIDIAの見解は?

フアン氏:私はエッジ側の演算性能も上がっていくと考えている。理由はネットワークの帯域に限りがあるからだ。エッジ側のデバイスがもっともっとインテリジェントになると、ネットワークに流すデータ量が増える。例えば、エッジ側になる自動車が撮影した画像データをすべてクラウドサーバーにアップロードしてから処理していれば、あっという間にネットワークの帯域は破綻してしまうだろう。そう考えれば、エッジ側である程度処理してからアップロードするとするのが正解だろう。だからエッジ側にももっと演算性能が必要になる。