ニュース
NVIDIA、Pascal GPUを採用した新型「Jetson TX2」を、AIエッジ向けに投入
従来製品2倍の電力効率を実現
2017年3月8日 15:28
- 2017年3月7日(現地時間、日本時間3月8日)
半導体メーカーのNVIDIAは3月7日(現地時間、日本時間3月8日)、同社の組み込み機器向けモジュール"Jetson"(ジェットソン)シリーズの最新製品としてJetson TX2(ジェットソンティーエックスツー)を発表したことを明らかにした。
従来製品となるJetson TX1は、Maxwell世代のGPUを搭載したTegra X1(テグラエックスワン、開発コードネーム:Erista)を採用していたが、Jetson TX2は開発コードネームParkerで知られる最新世代のSoC(この世代からTegraブランドの製品名は使われず、開発コードネームのParkerで呼ばれる)を採用しており、GPUもCPUも性能が大幅に引き上げられていることが最大の特徴になる。NVIDIAによれば、Jetson TX2の電力効率はJetson TX1に比べて2倍になっているという。
Jetson TX2はDeveloper Kitと呼ばれる開発ボードとセットになった開発キットが599ドル(1ドル=114円換算で、6万8286円)でアジア太平洋地域では4月から販売開始予定。製品に組み込んで出荷可能なProduction Moduleは1000個ロット時で399ドル(同、4万5486円)で、第2四半期(4月~6月期)に提供開始となる予定だ。
ソフトウェア開発キットのJETPACK 3.0を発表、システム性能が従来比2倍に
NVIDIAのJetsonシリーズは、組み込み機器向けの同社SoCを採用したモジュールで、最大の特徴は同社のCPUを利用した汎用コンピューティングのプラットフォームCUDAを利用できることにある。CUDAは、現在AIを実現するための演算方法であるディープラーニングに一般的に利用されている。このため、このCUDAをJetsonシリーズ上で利用することで、高度なAIの機能を組み込み機器上で実現することが可能になる。
このJetsonシリーズで利用できるソフトウェアプラットフォーム環境として、NVIDIAはJETPACKと呼ばれるソフトウェア開発キットを提供してきたが、今回NVIDIAはJETPACK 3.0と呼ばれるその最新バージョンを発表した。このJETPACK 3.0では「TensorRT 1.0」「cuDNN 5.1」「Vision Works」、各種API(Open GL 4.5、OpenGL ES 3.2、EGL 1.4、Vulkan 1.0)、「CUDA 8」などを、Jetson上で利用することが可能になりながら、従来比2倍のシステムパフォーマンスで実行することが可能になっている。
これにより、ディープラーニングを利用したAIのプログラムを、IoT(Internet of Things)機器などの組み込み機器側でも実行可能になる。例えば、ロボット、ドローン、自動運転自動車などをこのJetsonシリーズで開発して実現することが可能になるのだ。
SoCがTegra X1からParkerに強化され、電力効率が2倍に、ディープラーニングの性能も向上
NVIDIAはそうしたJetsonシリーズの最新製品として、Jetson TX2を発表した。Jetson TX2は、以前NVIDIAがリリースしていたJetson TX1の後継となる製品で、Jetson TX1とは400ピンコネクタがピン互換のモジュールとして提供される。
Jetson TX2のスペックは以下のようになっている。
表1 Jetson TX2とJetson TX1の比較(NVIDIA発表の資料より筆者作成、SoCの名前とプロセスルールは筆者が追加)
Jetston TX2 | Jetson TX1 | ||
---|---|---|---|
SoC | ブランド/コードネーム | Parker | Tegra X1(Erista) |
製造プロセスルール | 16nm | 20nm | |
GPU | NVIDIA Pascal, 256 NVIDIA CUDA Cores | NVIDIA Maxwell, 256 NVIDIA CUDA Cores | |
CPU | Dual Denver 2/2MB L2 +Quad ARM® A57/2MB L2 | Quad ARM A57/2MB L2 | |
ビデオエンコード | 4K × 2K 60Hz Encode (HEVC) | 4K × 2K 30 Hz Encode (HEVC) | |
ビデオデコード | 4K × 2K 60Hz Decode (12-Bit Support) | 4K × 2K 60 Hz Decode (10-Bit Support) | |
Jetston TX2 | Jetson TX1 | |
---|---|---|
メモリ | 8 GB 128-Bit LPDDR4(58.3 GB/s) | 4 GB 64-Bit LPDDR4(25.6 GB/s) |
ストレージ | 32 GB eMMC, SDIO, SATA | 16 GB eMMC, SDIO, SATA |
ディスプレイポート | HDMI 2.0 / eDP 1.4 / 2× DSI / 2× DP 1.2 | HDMI (4k 30 Hz) / eDP 1.4 / 2× DSI / DP 1.2 |
カメラ | Up to 6 Cameras (2 Lane) | Up to 6 Cameras (2 Lane) |
CSI2 | CSI2 D-PHY 1.2 (2.5 Gbps/Lane) | CSI2 D-PHY 1.1 (1.5 Gbps/Lane) |
PCI Express | Gen 2 | 1×4 + 1×1 ないしは 2×1 + 1×2 | Gen 2 | 1×4 + 1×1 |
そのほか | CAN, UART, SPI, I2C, I2S, GPIOs | UART, SPI, I2C, I2S, GPIOs |
USB | USB USB 3.0 + USB 2.0 | |
ネットワーク | 1 Gigabit Ethernet, 802.11ac WLAN(2×2), Bluetooth | |
サイズ | 50 mm × 87 mm (400-Pin Compatible Board-to-Board Connector) | |
Jetson TX2の最大の特徴は、採用されているSoCが強化されていることだ。Jetson TX1で採用されていたSoCは、NVIDIAがTegra X1のブランド名で提供しているSoC。開発コードネームErista(アリスタ)で知られている同製品は、GPUはNVIDIAの前世代のアーキテクチャとなるMaxwell世代で、CPUはクアッドコアのARM Cortex-A57となっていた。
これに対してJetson TX2ではParkerの開発コードネームで知られる新世代のSoCが採用されている。Parkerは製造プロセスルール16nmに微細化されており、CPUとGPUが大幅に強化されている。GPUは、NVIDIAの最新アーキテクチャであるPascalベースになっている。これに伴い、半精度の浮動小数点演算(FP16)が利用可能で、ディープラーニング時の性能が大きく向上する。演算器となるCUDAコアはErista世代と同じ256個になっている。
CPUは従来製品がCortex-A57のクアッドコア構成になっていたのに対して、ParkerではDenver 2.0と呼ばれるNVIDIAが自社開発した64bit ARMプロセッサがデュアルコア構成で、Cortex-A57クアッドコアも搭載されている。6コア全部を使うことも可能だし、Cortex-A57だけに切り換えて省電力動作することも可能になっている。
NVIDIAによれば、Jetson TX2の性能は同じ電力枠(15W以下)であれば2倍の性能を実現しており、同じ性能であれば7.5W以下という半分の電力枠で動作する。Jetson TX2では前者をMAX-P(最大パフォーマンス)、後者をMAX-Q(最大効率)と呼んでおり、ユーザーの選択次第で性能優先か、電力効率優先かを選択して利用することが可能だ。
なお、NVIDIAはErista世代までは“Tegra ***”というブランド名を使っていたが、Parker世代以降は、特にブランド名はアナウンスしていない。従来のJetson TX1ではTegra X1を搭載していたのでJetson TX1という製品名になっていたが、今回のJetson TX2ではParkerがTegra X2であるためにJetson TX2になっているのではなく、単にJetson TX1の次の製品という意味でJetson TX2という製品名になっているようだ。
メモリは8GBに、ストレージも32GBに強化されている、CANにも対応
Jetson TX2ではSoCだけでなく、モジュールに搭載されているメモリやストレージも強化されている。メモリはJetson TX1が4GB/LPDDR4だったのに対して、Jetson TX2では8GB/LPDDR4に強化されている。さらにメモリのバス幅が64bit から128bit に強化されているため、メモリ帯域幅が従来製品比で倍の58.4GB/秒に引き上げられている。
また、ストレージもJetson TX1では16GBのeMMCだったのに対して、Jetson TX2では32GB eMMCへと強化されている。また従来製品と同じようにSDIO、SATAのインターフェースにも対応しており、ユーザーが自前のストレージを活用するという使い方も可能だ。
このほか、HDMI 2.0のディスプレイ出力に対応したこと,カメラへの接続インターフェースとなるCSI2の帯域幅が強化されていること、さらに外部バスで従来からサポートされているUART、SPI、I2C、GPIOなどに加えてCANに対応している事も特徴となっている。
開発キットは599ドルで4月から提供開始、製品版モジュールは399ドルで第2四半期より提供開始
Jetson TX2は、従来のJetson TX1と同じように50×87mmのボードサイズで提供され、TX1とピン互換の400ピンボードコネクタを備えている。提供形態も従来と同様で、各種の外部インターフェースが利用可能な開発ボードとセットのDeveloper Kitでの提供と、外部への販売も可能なProduction Moduleでの提供と、2つの形で提供される。
Developer KitはUSB端子(USB 3.0 Type-A、USB 2.0 microAB)、HDMI、M.2、PCI Express X4、イーサネット、SDカードスロット、SATAポート、GPIO、I2C、SPI、CANなどの端子を備えており、これを利用してソフトウェアを開発し、その後Production Moduleを利用して最終製品の出荷が可能になる。Developer Kitの価格は599ドル(1ドル=114円換算で、6万8286円)でアジア太平洋地域では4月から販売開始予定。学生などの教育向け価格は299ドル(同、3万4086円)。
Production Moduleは1000個ロット時で399ドル(同、45,486円)で、第2四半期(4月~6月期)に提供開始となる予定。
現在のJetson TX1は日本ではFAとロボットの大手メーカーであるファナック、トヨタ自動車のヒューマンサポートロボットなどに採用されており、Jetson TX2の発表に合わせて、両社からもそれに期待するコメントが出されている。