ニュース

【GTC2014】NVIDIA、基調講演でCUDAを自動車にもたらす開発キット「JETSON TK1」の提供開始など発表

NVLink、3Dメモリで、帯域幅問題を解消する新GPU「Pascal(パスカル)」も計画

2014年3月24日~27日開催(現地時間)

 半導体メーカーのNVIDIAは、同社製品の開発者を対象とした開発者向け会議GTCをアメリカ合衆国カリフォルニア州サンタクララ市にあるサンノゼコンベンションセンターで3月24日~27日(現地時間)の4日間に渡り開催している。2日目となる3月25日には、同社の創始者でCEOのジェン・スン・フアン氏による基調講演が行われ、同社製品のロードマップや新技術などの解説が行われた。

NVIDIA 共同創始者でCEOのジェン・スン・フアン氏

 この中でフアン氏は「コンピュテーショナルグラフィックスが今後の鍵になる」と述べ、同社の主力製品であるGPU(Graphics Processing Unit)を利用した汎用演算を、物体認識やAR(仮想現実)などを利用したドライバーアシスタント機能に利用したり、それを機械学習(Machine Learning)などに活用することで、デジタル機器の活用方法をさらに広げていくことが可能だとアピールした。

 自動車関連の内容が盛りだくさんの講演になっており、機械学習のエリアでは日本の自動車部品製造の最大手デンソーがパートナーとなることが発表されたほか、NVIDIAの製造業向けクラウドソリューションとなるIRAY VCAを利用した本田技術研究所のデモ、独アウディと共同で開発されたNVIDIAの最新製品「Tegra K1」を搭載した自動運転の実証実験車「A7」などが紹介された。

GTCは毎年拡張を続けており、ついに今年は700を越えるセッションが用意されている
2014年の基調講演はCUDA Everywhere、つまりどんな分野でもCUDAを活用して汎用コンピューティングが広がっていくという内容に

GPUを利用した汎用コンピューティングCUDAをテーマに講演を行ったフアン氏

 NVIDIAの共同創始者でCEOともしても知られるジェン・スン・フアン氏は、同社を1993年に設立して以来、一貫して同社の強みであるグラフィックス技術をコアにして、さまざまな半導体製品を送り出し、現在はPC向けのGeForce、ワークステーション向けのQuadro、HPC(High Performance Computing、科学技術演算などに用いられる超高性能なコンピュータのこと、いわゆるスーパーコンピュータ)向けの製品となるTesla、さらには自動車やタブレットなどをターゲットにしたTegraという4つの製品を展開しており、グラフィックス関連の半導体メーカーとしては大手メーカーとなる。

 そのフアン氏は「2010年に開催したGTCでは、400近いセッションがある程度だった。しかし、現在では729のセッションを超えるまでになっており、注目されるイベントになっている」と、GTCが年々成長していることをアピールした。NVIDIAの発表によれば、参加者は3500人を超えているとのことで、エンジニアの注目も年々高まっている。そうした同社が飛躍するきっかけとなったのは、CUDAと呼ばれる開発環境を導入したことにある。NVIDIAがCUDAを導入する前は、同社の主力製品であるGPUは、PlayStationなどのゲームコンソールや、デスクトップPCなどがその代表的なアプリケーションで、単にグラフィックスを処理するだけの半導体として利用されていた。しかし、NVIDIAがCUDAを導入したことで、GPUをグラフィックスだけでなく、さまざまな汎用的な演算に利用できるようになり、その利用することができるエリアは大きく広がることになった。それと共に、NVIDIAは大きな成長を遂げ注目される存在になっていったのだ。今回のフアン氏の基調講演のテーマは“CUDA Everywhere”(どの分野にもCUDAを)といったモノで、まさにそうしたCUDAをフィーチャーした講演内容となった。

NVLink、3Dメモリで、GPU性能のボトルネックになっている帯域幅の問題を改善するPascal

 最初にフアン氏が説明したのは、同社の創業ビジネスと言えるGPUで、同社が2016年に導入を計画している次世代GPUとなる「Pascal(パスカル)」について説明した。フアン氏は「現在のGPUでは明快なボトルネックがある、それが帯域幅だ」と述べ、GPUが現在抱えている課題を解決する必要があるとした。GPUというのは、PCやタブレット、そして各種のデジタル機器に内蔵されている半導体だが、ストレージからメモリへデータを読み込んできて、それを処理してディスプレイに表示するという役割を果たしている。また、すでに述べた通りで、同社のCUDAという仕組みを利用すると、汎用のデータ処理にすることも可能になっている。

 しかし、そうしたGPUの処理は、CPUと間でデータを転送するとき、あるいはメモリからデータを読み出すときなどの速度(帯域幅と呼ばれる)に依存しており、その帯域幅がボトルネックになってしまい性能が上がらないことがある。そこで、同社が2016年に導入する予定のPascalでは、新しくNVLink(エヌブイリンク)と呼ばれる専用インターコネクタ(チップとチップを接続する経路のこと)で接続し、それまで利用されていたPCI Expressに比べて5~12倍の帯域幅を実現する。また、NVLinkはマルチGPUと呼ばれる複数のGPUを並列に接続して演算を行う用途にも利用することが可能になっており、その場合には5倍の帯域幅を実現することができる。

現代のGPUのボトルネックは、CPU-GPU間、あるいはGPU-メモリ間の帯域幅になっている
Pascalで導入されるNVLinkでは現在のPCI Expressに比べて5~12倍の帯域幅を実現する
HPCなどでGPUが複数あるような環境(マルチGPU)でデータのやりとりを行う場合にもNVLinkが利用される

 また、Pascalでは3Dメモリと呼ばれる、製造時に複数のチップを積層することでより大容量で、帯域幅を向上させる仕組みを導入する。NVIDIAが導入する3Dチップは、半導体を製造する段階で、複数のチップを積層する方法で容量では2.5倍、電力効率は4倍という性能を実現する。フアン氏によれば、Pascalが導入される2016年にはメモリの帯域幅が現在の4倍程度の向上する見通しだという。

フアン氏が手に持つのがPascalを搭載したモジュール

 フアン氏はこうしたPascalを搭載したモジュールを初めて公開した。このモジュールは、現在PC用の拡張カードとして提供されているビデオカードに比べてサイズは1/3で、NVLinkによりバス帯域幅は5~12倍に、3Dメモリによりメモリの帯域幅とメモリ容量は2~4倍にとなる見通しだという。フアン氏が説明したとおり、現在のGPUの性能のボトルネックは帯域幅にあるので、それが改善されるPascalは大幅に性能が向上する可能性があると言えるだろう。

メモリの帯域幅を上げるために3Dメモリが導入される。ウェハーと呼ばれる半導体を1枚の板として製造する段階で、複数の層を積層する形になる
Pascalの開発コードネームは、17世紀の科学者であるブレーズ・パスカルにちなんでいる、パスカルの定理などで知られる科学者だ。ちなみに、その前のKeplerも、Maxwellも科学者の名前にちなんでいる
NVIDIAの次世代のGPUの名前はPascal、NVLink、3Dメモリに対応し、より小型のモジュールに搭載できる
NVIDIAのGPUロードマップ。現行製品のKepler、Maxwell、Pascalと進化していく

注目の機械学習の分野でデンソーと提携することが発表される

 次いでフアン氏はMachine Learning(機械学習)と呼ばれるテーマへと話を移した。機械学習とは、コンピュータが自律的に学習をして、人間の脳とおなじようにさまざまな判別を行うコンピュータの研究開発のことを意味している。この機械学習は、いってみれば人間の脳をシミュレーションするようなもので、ニューロンと呼ばれるニューロンと呼ばれる神経細胞をシミュレーションするなど、各種の研究がさまざまな研究機関で行われている。

 例えば、米国のスタンフォード大学とGoogleが共同研究として行っているGoogle Brainでは、1000台のサーバーPC上に2000個のCPUを搭載して、合計で1万6000個のCPUコア上で、さまざまな演算が行われてシミュレーションを行っている。このサーバーシステム全体にかかっているコストは500万ドル(日本円で50億円)で、システムを動かすのに600kWもの電力がかかるという。

 これまでこうした汎用演算に利用されてきたCPUは、応答性の点では優れているのだが、大量のデータを1度に処理するのはGPUに比べて効率が悪いという弱点がある。そこで、NVIDIAが提案しているようなGPUとCUDAという仕組みを利用すると、CPUでやる場合に比べて電力効率も高く、かつより高性能に実現することができる。「仮に現行のシステムのままで人間の脳をシミュレートしようとすれば、150ヨタFLOPS(1ヨタ=1,000,000,000,000テラ)が必要になり、消費電力も数ヨタW、時間にすると4万年かかる計算になる。しかし、これをGPUに置きかえることで、もっとその期間を短縮できる」と述べ、NVIDIAのGPUベースのシステムに交換すれば同じ性能を持つシステムが、わずか3万3千ドル(日本円で約330万円)で消費電力も4kWで済ますことができるとアピールした。

 その上で、業界の各社とこの機械学習の機能を、同社のCUDAで実現する取り組みを進めていくとし、Adobe、IBM、Baiduなど以前から進めてきた企業と共に、今回Facebookやスタンフォード大学、そして日本の自動車部品メーカー最王手のデンソーが新しいパートナーとして加わったことを明らかにした。なお、現時点ではデンソーがどのような取り組みを行っていくのかは明確ではないが、現地時間明日(3月26日)にはデンソーによるセミナーなどが予定されており、その中で明らかになってくるだろう。

機械学習(Machine Learning)は、これからの注目分野。物体認識なども含めて自動車分野への応用も考えられるジャンル
機械学習では人間の脳をシミュレートしているような複雑な演算を行う必要がある
例えば、人の顔の認識、猫の顔の認識、人間の脳ならすぐだが、コンピュータには膨大な計算が必要になる
スタンフォード大学とGoogleの共同プロジェクトであるGoogle Brainでは16,000のCPUコアを利用して行っているが、電力は600kWで、システム全体の価格は500万ドル(日本円で5億円)
NVIDIAのTeslaを利用した機械学習のデモ。フェラーリと音声入力するだけでそれにあった画像をコンピュータが自分で探してくる
CUDAを利用した機械学習の取り組みには、今後日本のデンソーも参加することが明らかにされた

IRAY VCAの発表では、ホンダのTOPSシステムをベースにしたCGモデリング技術がデモされる

 ついでフアン氏はPC向けのビデオカードと同社のクラウド向け新サーバーに関する発表を行った。フアン氏が発表したGeForce TITAN Z2(ジーフォース タイタン ゼット)は、同社のGK110と呼ばれるKeplerベースのGPUが2つ搭載されているビデオカードで、1枚のPCI Expressベースのビデオカード(2スロットを消費する)で、5,760CUDAコア、12GBメモリ、8TFLOPSの性能という、一昔前のスーパーコンピューターに匹敵するような性能を実現している。米国での市場予想想定価格が2999ドル(日本円で約30万円)という驚くべき価格に設定されている。

 フアン氏がもう1つ発表したハードウェアがIRAY VCA(アイレイヴィーシーエー)というクラウドサーバーで、4Uのラックマウントサーバーに8枚のKeplerベースのGPUと、GPUあたり12GBのメモリが搭載されるという高い演算性能を実現した製品になっている。このIRAY VCAは、同社がワークステーション向けに提供しているQuadroというGPUの替わりにクラウド上でレンダリングサーバーとして活用することができる。フアン氏によれば「CPUに比べれば60-70倍、Quadro K5000に比べて10倍もの性能が、わずか5万ドル(日本円で500万円)で実現できる」とのことで、安価にかつ低消費電力で高いレンダリング性能を入手することができるとした。

 なお、このIRAY VCAのデモには、本田技術研究所が開発するアコードを、レイトレーシングと呼ばれる手法を利用して3Dモデリング化してそれをリアルタイムに表示するデモが利用された。ホンダはTOPSと呼ばれる自社製のソフトウェアを利用して、自動車の試作をコンピューター上だけで行う仕組みをすでに導入しており(別記事[http://car.watch.impress.co.jp/docs/news/20130805_610233.html]参照)、自動車の試作をコンピュータだけで行うことができる仕組みが導入されている。今回はそれをIRAY VCAに対応させたデモだと考えることができ、アングルを変えたり、切り取る位置を変えたりということが思い通りに出来る様子がデモされた。

 フアン氏はさらに、同社のGPUのクラウド化技術であるGRIDの進展として、仮想化技術のリーディングソフトウェアベンダであるVMWareとの提携を発表し、VMWareが提供するHorizon DaaSプラットフォームにおいて、同社のGPU仮想化技術であるNVIDIA GRIDがサポートされる予定であることを明らかにした。

NVIDIAが発表した新しいビデオカードのGeForce TITAN Z。GK110を2つ搭載しており、12GBのビデオメモリ、8TFLOPSという性能で、米国での価格は2999ドル(日本円で約30万円)
GeForce TITAN Zのビデオカードは2スロットを消費するタイプのカード
レイトレーシングという手法を利用すると、写真品質のCGを実現することができる。この例は左がCG
NVIDIAが発表したIRAY VCAは、KeplerベースのGPUをネットワーク経由でレンダリングに利用することが可能になるアプライアンス
CGで作成したアコードのモデルを実際に回転できるモデル。従来のTOPSでは動いていなかったが、今回のデモではリアルタイムで動かすことができていた
CGなので、リルタイムに車体の中を切り取って見ることもできる
IRAY VCAのパフォーマンスはCPUだけでレンダリングした場合の70倍近くになる
仮想化ソフトウェアの大手となるVMWareとの提携が発表された
HONDA TOPS

Tegra K1を搭載したJETSON TK1を搭載したAudiのコンセプトカーで自動運転

 最後にフアン氏は、モバイル分野へと話を進めた。モバイル分野といっても、今話題のスマートフォンやタブレットだけでなく、フアン氏の興味はさらにその先、具体的には自動車向けのソリューションが話題の中心となった。
 NVIDIAは1月にラスベガスで行われたInternational CESにおいて、同社のモバイル向けSoC(System On a Chip)の最新版としてTegra K1(テグラケーワン)をリリースした。Tegra K1は、PC用のGPUとして提供されているKepler(ケプラー、開発コードネーム)をGPUとして統合したSoCで、32bitCPUとなるCortex-A15が搭載されたバージョンが今年の前半中に、64bitCPUとなるDenver(デンバー、開発コードネーム)を搭載したバージョンが今年の後半にリリースされる予定になっている。GPUにKeplerを搭載したことで、これまでのTegraシリーズでは対応していなかったCUDAに対応しており、GPUを利用したさまざまな演算を行えるようになっている。

 今回フアン氏はそのTegra K1を搭載した開発キットとなるJETSON TK1を紹介し、「JETSON TK1と提供するSDKを利用すれば、開発者は状況認識、物体認識、3Dカメラなどさまざまなアプリケーションに対応したソフトウェアを簡単に開発することができるようになる」とアピールした。JETSON TK1は組み込み向けの小型マザーボードに、SoCのTegra K1、メモリ、ストレージなどをオンボードで搭載した開発キットで、開発者はNVIDIAから提供されるVisionWorks SDKなどの開発キットを利用して開発したソフトウェアを実際に試すことができるようになっている。米国での価格は192ドルで、本日(現地時間3月25日)から予約が開始される。なお、NVIDIAによれば日本でも販売予定があり、菱洋エレクトロを通じて販売される予定だ。

 さらにフアン氏はTegraシリーズの将来のロードマップについても触れ、Tegra K1の後継製品として2015年にErista(エリスタ、開発コードネーム)を計画していることを明らかにした。Eristaは、GPUとしてTegra K1に内蔵されているKeplerよりも1世代新しいMaxwell(マックスウェル、開発コードネーム)を搭載した製品となり、処理能力が大幅に向上するのが大きな強化点となる。

 その後、フアン氏は独アウディ先端開発ヘッドのアンドレアス・リッチ氏を壇上に呼び、NVIDIAとアウディが共同で開発している自動運転コンセプトカーを公開した。ビデオで、自動運転でパーキングスペースを探す様子が公開されたほか、実際のコンセプトカーをステージ上で自動運転させる様子などもデモされた。そのデモカーの演算装置として利用されていたのは、JETSON TK1をコアにしたモジュールで、実際にTegra K1ですべてのシステムがコントロールしている様子などが明らかにされた。

 なお、講演の最後にフアン氏は「One more thingsがある……」と述べ、同社が2013年にリリースしたポータブルゲーム機「SHIELD」を紹介し「今回はすべての参加者にこのSHIELDをプレゼントしたい」と述べると、来場者からはヤンヤの歓声があがり、大盛況のうちに基調講演は終演することになった。

Tegra K1の最大の特徴は、GPUがPCに利用されているKeplerと同じアーキテクチャになったこと
CUDAを利用して物体認識などを行っていく
NVIDIAはTegra K1を搭載した開発キットJETSON TK1を発表、米国での価格は192ドルから、日本では菱洋エレクトロを通じて販売される
JETSON TK1を持つフアン氏
NVIDIAのTegraシリーズのロードマップ。Tegra K1の後継はMaxwell内蔵のErista(エリスタ)
独アウディ先端開発ヘッドのアンドレアス・リッチ氏(左)
車に搭載されているカメラで撮影した画像を解析しながら自動運転を行っている
舞台の袖からアウディ A7が自動運転で登場
以前の開発車ではこんな状態だったのが……
今回のコンセプトカーでは、自動運転を行っているコンピュータのユニットはわずかこれだけ
JETSON TK1を搭載した自動運転のヘッドユニットを手にアピールするフアン氏
最後にフアン氏が、参加者全員にSHIELDをプレゼントすることを明らかにすると、会場は熱気に包まれた

(笠原一輝)