ニュース

NVIDIA、Pascal GPUを採用した新型「Jetson TX2」を、AIエッジ向けに投入

従来製品2倍の電力効率を実現

2017年3月7日(現地時間、日本時間3月8日)

NVIDIAが発表したJetson TX2のProduction Module

 半導体メーカーのNVIDIAは3月7日(現地時間、日本時間3月8日)、同社の組み込み機器向けモジュール"Jetson"(ジェットソン)シリーズの最新製品としてJetson TX2(ジェットソンティーエックスツー)を発表したことを明らかにした。

 従来製品となるJetson TX1は、Maxwell世代のGPUを搭載したTegra X1(テグラエックスワン、開発コードネーム:Erista)を採用していたが、Jetson TX2は開発コードネームParkerで知られる最新世代のSoC(この世代からTegraブランドの製品名は使われず、開発コードネームのParkerで呼ばれる)を採用しており、GPUもCPUも性能が大幅に引き上げられていることが最大の特徴になる。NVIDIAによれば、Jetson TX2の電力効率はJetson TX1に比べて2倍になっているという。

 Jetson TX2はDeveloper Kitと呼ばれる開発ボードとセットになった開発キットが599ドル(1ドル=114円換算で、6万8286円)でアジア太平洋地域では4月から販売開始予定。製品に組み込んで出荷可能なProduction Moduleは1000個ロット時で399ドル(同、4万5486円)で、第2四半期(4月~6月期)に提供開始となる予定だ。

ソフトウェア開発キットのJETPACK 3.0を発表、システム性能が従来比2倍に

 NVIDIAのJetsonシリーズは、組み込み機器向けの同社SoCを採用したモジュールで、最大の特徴は同社のCPUを利用した汎用コンピューティングのプラットフォームCUDAを利用できることにある。CUDAは、現在AIを実現するための演算方法であるディープラーニングに一般的に利用されている。このため、このCUDAをJetsonシリーズ上で利用することで、高度なAIの機能を組み込み機器上で実現することが可能になる。

JETPACK 3.0が発表される

 このJetsonシリーズで利用できるソフトウェアプラットフォーム環境として、NVIDIAはJETPACKと呼ばれるソフトウェア開発キットを提供してきたが、今回NVIDIAはJETPACK 3.0と呼ばれるその最新バージョンを発表した。このJETPACK 3.0では「TensorRT 1.0」「cuDNN 5.1」「Vision Works」、各種API(Open GL 4.5、OpenGL ES 3.2、EGL 1.4、Vulkan 1.0)、「CUDA 8」などを、Jetson上で利用することが可能になりながら、従来比2倍のシステムパフォーマンスで実行することが可能になっている。

 これにより、ディープラーニングを利用したAIのプログラムを、IoT(Internet of Things)機器などの組み込み機器側でも実行可能になる。例えば、ロボット、ドローン、自動運転自動車などをこのJetsonシリーズで開発して実現することが可能になるのだ。

SoCがTegra X1からParkerに強化され、電力効率が2倍に、ディープラーニングの性能も向上

 NVIDIAはそうしたJetsonシリーズの最新製品として、Jetson TX2を発表した。Jetson TX2は、以前NVIDIAがリリースしていたJetson TX1の後継となる製品で、Jetson TX1とは400ピンコネクタがピン互換のモジュールとして提供される。

Jetson TX2の概要

Jetson TX2のスペックは以下のようになっている。

表1 Jetson TX2とJetson TX1の比較(NVIDIA発表の資料より筆者作成、SoCの名前とプロセスルールは筆者が追加)
Jetston TX2Jetson TX1
SoCブランド/コードネームParkerTegra X1(Erista)
製造プロセスルール16nm20nm
GPUNVIDIA Pascal, 256 NVIDIA CUDA CoresNVIDIA Maxwell, 256 NVIDIA CUDA Cores
CPUDual Denver 2/2MB L2 +Quad ARM® A57/2MB L2Quad ARM A57/2MB L2
ビデオエンコード4K × 2K 60Hz Encode (HEVC)4K × 2K 30 Hz Encode (HEVC)
ビデオデコード4K × 2K 60Hz Decode (12-Bit Support)4K × 2K 60 Hz Decode (10-Bit Support)
Jetston TX2Jetson TX1
メモリ8 GB 128-Bit LPDDR4(58.3 GB/s)4 GB 64-Bit LPDDR4(25.6 GB/s)
ストレージ32 GB eMMC, SDIO, SATA16 GB eMMC, SDIO, SATA
ディスプレイポートHDMI 2.0 / eDP 1.4 / 2× DSI / 2× DP 1.2HDMI (4k 30 Hz) / eDP 1.4 / 2× DSI / DP 1.2
カメラUp to 6 Cameras (2 Lane)Up to 6 Cameras (2 Lane)
CSI2CSI2 D-PHY 1.2 (2.5 Gbps/Lane)CSI2 D-PHY 1.1 (1.5 Gbps/Lane)
PCI ExpressGen 2 | 1×4 + 1×1 ないしは 2×1 + 1×2Gen 2 | 1×4 + 1×1
そのほかCAN, UART, SPI, I2C, I2S, GPIOsUART, SPI, I2C, I2S, GPIOs
USBUSB USB 3.0 + USB 2.0
ネットワーク1 Gigabit Ethernet, 802.11ac WLAN(2×2), Bluetooth
サイズ50 mm × 87 mm (400-Pin Compatible Board-to-Board Connector)
Jetson TX2のスペックを説明するスライド

 Jetson TX2の最大の特徴は、採用されているSoCが強化されていることだ。Jetson TX1で採用されていたSoCは、NVIDIAがTegra X1のブランド名で提供しているSoC。開発コードネームErista(アリスタ)で知られている同製品は、GPUはNVIDIAの前世代のアーキテクチャとなるMaxwell世代で、CPUはクアッドコアのARM Cortex-A57となっていた。

 これに対してJetson TX2ではParkerの開発コードネームで知られる新世代のSoCが採用されている。Parkerは製造プロセスルール16nmに微細化されており、CPUとGPUが大幅に強化されている。GPUは、NVIDIAの最新アーキテクチャであるPascalベースになっている。これに伴い、半精度の浮動小数点演算(FP16)が利用可能で、ディープラーニング時の性能が大きく向上する。演算器となるCUDAコアはErista世代と同じ256個になっている。

 CPUは従来製品がCortex-A57のクアッドコア構成になっていたのに対して、ParkerではDenver 2.0と呼ばれるNVIDIAが自社開発した64bit ARMプロセッサがデュアルコア構成で、Cortex-A57クアッドコアも搭載されている。6コア全部を使うことも可能だし、Cortex-A57だけに切り換えて省電力動作することも可能になっている。

Jetson TX2に用意される2つのモード

 NVIDIAによれば、Jetson TX2の性能は同じ電力枠(15W以下)であれば2倍の性能を実現しており、同じ性能であれば7.5W以下という半分の電力枠で動作する。Jetson TX2では前者をMAX-P(最大パフォーマンス)、後者をMAX-Q(最大効率)と呼んでおり、ユーザーの選択次第で性能優先か、電力効率優先かを選択して利用することが可能だ。

 なお、NVIDIAはErista世代までは“Tegra ***”というブランド名を使っていたが、Parker世代以降は、特にブランド名はアナウンスしていない。従来のJetson TX1ではTegra X1を搭載していたのでJetson TX1という製品名になっていたが、今回のJetson TX2ではParkerがTegra X2であるためにJetson TX2になっているのではなく、単にJetson TX1の次の製品という意味でJetson TX2という製品名になっているようだ。

メモリは8GBに、ストレージも32GBに強化されている、CANにも対応

 Jetson TX2ではSoCだけでなく、モジュールに搭載されているメモリやストレージも強化されている。メモリはJetson TX1が4GB/LPDDR4だったのに対して、Jetson TX2では8GB/LPDDR4に強化されている。さらにメモリのバス幅が64bit から128bit に強化されているため、メモリ帯域幅が従来製品比で倍の58.4GB/秒に引き上げられている。

 また、ストレージもJetson TX1では16GBのeMMCだったのに対して、Jetson TX2では32GB eMMCへと強化されている。また従来製品と同じようにSDIO、SATAのインターフェースにも対応しており、ユーザーが自前のストレージを活用するという使い方も可能だ。

 このほか、HDMI 2.0のディスプレイ出力に対応したこと,カメラへの接続インターフェースとなるCSI2の帯域幅が強化されていること、さらに外部バスで従来からサポートされているUART、SPI、I2C、GPIOなどに加えてCANに対応している事も特徴となっている。

開発キットは599ドルで4月から提供開始、製品版モジュールは399ドルで第2四半期より提供開始

 Jetson TX2は、従来のJetson TX1と同じように50×87mmのボードサイズで提供され、TX1とピン互換の400ピンボードコネクタを備えている。提供形態も従来と同様で、各種の外部インターフェースが利用可能な開発ボードとセットのDeveloper Kitでの提供と、外部への販売も可能なProduction Moduleでの提供と、2つの形で提供される。

Jetson TX2のDeveloper Kitの価格と提供時期
Jetson TX2のDeveloper Kit

 Developer KitはUSB端子(USB 3.0 Type-A、USB 2.0 microAB)、HDMI、M.2、PCI Express X4、イーサネット、SDカードスロット、SATAポート、GPIO、I2C、SPI、CANなどの端子を備えており、これを利用してソフトウェアを開発し、その後Production Moduleを利用して最終製品の出荷が可能になる。Developer Kitの価格は599ドル(1ドル=114円換算で、6万8286円)でアジア太平洋地域では4月から販売開始予定。学生などの教育向け価格は299ドル(同、3万4086円)。

Jetson TX2のProduction Moduleの価格と提供時期
Jetson TX2のProduction Module

 Production Moduleは1000個ロット時で399ドル(同、45,486円)で、第2四半期(4月~6月期)に提供開始となる予定。

ファナック、トヨタ自動車からのコメント

 現在のJetson TX1は日本ではFAとロボットの大手メーカーであるファナック、トヨタ自動車のヒューマンサポートロボットなどに採用されており、Jetson TX2の発表に合わせて、両社からもそれに期待するコメントが出されている。