ニュース

ザイリンクス、スバルの「アイサイトX」に搭載されるZynqの後継「Versal AI Edge」

2021年6月9日 発表

ザイリンクスが発表した車載などエッジ向けのFPGA一体型SoCとなる「Versal AI Edge」、車載グレードやISO 26262の機能安全認証を取得している

 半導体メーカーのXilinx(ザイリンクス)は6月9日、2020年にスバルが発売した新型「レヴォーグ」に搭載されているADASユニット「アイサイトX」の心臓部として採用されている「Zynq UltraScale+ MPSoC」の後継とも位置付けられる「Versal AI Edge」を発表した。

 ザイリンクスによれば「Versal AI Edge」は、すでに販売されている「Versal ACAP」(バーサルエイキャップ)の新しいシリーズと位置付けており、エッジデバイスと呼ばれる自動車、ドローンやロボットなどをターゲットにした製品となる。従来車載用として利用されてきたZynq UltraScale+と比較して、消費電力はほぼ同じながら、実装面積は58%削減されシステム基板の小型化が可能になり、演算性能は4.4倍になるとザイリンクスでは説明している。

スバルのアイサイトXに採用されているZynq UltraScale+を置き換えるVersal AI Edge

Versal AI Edgeは車載、ロボット、ドローン、デジタルヘルスケアなどを対象にしている

 ザイリンクスはFPGA(Field-Programmable Gate Array)と呼ばれるプログラマブルな演算ロジックのトップメーカーで、2020年x86互換プロセッサメーカーとして知られているAMDに買収され、2021年度中にはAMDの一部として合併する予定となっている。通常のプロセッサ、例えばそのAMDが販売しているx86互換プロセッサの場合には、あらかじめ動作が規定されている演算装置が搭載されており、それを利用してソフトウエアは各種の演算をする。こうした演算装置には、処理を次々に高速に処理していくことに適したもの(CPUなど)、複数の処理を並列に処理していくのに適したもの(GPUなど)があり、現在のソフトウエアは処理に応じてより性能が高いプロセッサを利用して演算していく仕組みになっている。

 そうした用途が決まっているCPUやGPUに対して、FPGAは演算器の構造は出荷時では規定されておらず、ソフトウエアによりその仕組みを定義することが可能だ。誤解を恐れずに言えば、ソフトウエアの定義により、CPUにもなるし、GPUにもなる、そうした便利なものがFPGAと言うことができるだろう。

 そうしたザイリンクスのFPGAは車載用としても活用されている。FPGAをうまく使うと、AIの実現に利用されるディープラーニングの推論を効率よく行なうことができるからだ。ディープラーニング向けの演算器といえばGPUが使われるのがこれまで一般的だったが、ここ数年はGPUよりもさらに効率よく演算できる演算器としてFPGAが注目されるようになっている。

 そうしたザイリンクスのFPGAを採用している車両の代表例が、2020年にスバルが発表した新型レヴォーグ。搭載されているのは、ザイリンクスが提供している「Zynq UltraScale+ MPSoC」で、今回ザイリンクスが発表したのはそのZynq UltraScale+シリーズを置き換えて利用できる新しい製品。今回発表されたのはすでに市場に投入されている「Versal ACAP」の新バリエーションとなる「Versal AI Edge」。Versal AI Edgeは、自動車、ロボット、ドローンやデジタルヘルスケアなどをターゲットにした製品になっている。

スバルの新型「アイサイトX」、心臓部にザイリンクスのFPGAを採用 新型「レヴォーグ」を支えるZynq UltraScale+ MPSoC

https://car.watch.impress.co.jp/docs/news/1270746.html

AIエンジンなどが強化されているVersal AI Edge、AI推論時の性能が4倍に強化される

Versal AI Edgeの概要、Arm CPU、FPGAアレイ、AIエンジン、DSPなどが1チップになっているSoC

 Versal AI Edgeはいくつかの点で強化されている。Versal AI EdgeはArm CPU(Cortex-A72/デュアルコア)、FPGAアレイ、ディープラーニングの推論を処理するAIエンジン、DSPなどが1チップに統合されているのだが、その中でもAIエンジンが大きく強化されている。

AIエンジンの拡張
マシンラーニングの演算が1/2のレイテンシで4倍の性能に

 AIエンジンは演算器が倍増されており、INT8の性能が倍増している。さらにそのINT8の演算器を利用してINT4やBflot16(16ビットの浮動小数点演算をINT8に置き換えて演算する手法、AI推論では一般的に活用されている)などをネーティブでサポートしている。また、それぞれの演算器に用意されているローカルメモリ(データメモリ)が32KBから64KBに強化されており、この点でも性能が強化されている。また、AIエンジン全体のメモリとして動作するメモリタイルは38MB搭載されており、従来製品と比較して4倍のマシンラーニングの推論を、半分のレイテンシ(遅延)で実現することが可能になっている。

アクセラレータRAM
NVIDIAのXavierとの1Wあたりの性能比較

 また、SoC全体の一種のキャッシュメモリとして動作するアクセラレータRAMが4MB搭載されており、一種のローカルメモリとしても利用することができる。そうした強化により、NVIDIAのXavierと比較して電力1Wあたりの性能では4倍になっているとザイリンクスでは説明している。

Zynq UltraScale+シリーズとの比較

 スバルのアイサイトXのように従来車載用として提供されてきたZynq UltraScale+シリーズとの比較では、消費電力はほぼ同じで、3つのチップを1つのチップに統合できるためチップの実装面積は58%削減することが可能になっており、システム基板をより小型化することが可能になる。また、サポートできるカメラの画素数が増え、AI推論時の性能は4TOPSから17.4TOPSへと増えることになり、性能は約4.4倍になるとザイリンクスでは説明している。また、ISO 26262の機能安全認証も取得しており、稼働保証温度の拡大など車載グレードとしての基本要件も満たしている。

SKU構成
他社製品とのポジション比較

 ザイリンクスによれば、Versal AI Edgeには消費電力とAI演算性能の違いなどで7つのSKU(モデルのこと)が用意されている。最上位のグレードはAE2802で、75Wの消費電力で228TOPS(INT8)の性能を実現する。そのほかにもAE1752(124TOPS/50~60W)、AE2602(120TOPS/50~60W)、AE2302(31TOPS/約20W)、AE2202(21TOPS/15~20W)、AE2102(10TOPS/7~10W)、AE2002(7TOPS/6~9W)が用意されており、同社が提供する開発キットを利用した開発したソフトウエアがスケーラブルに動作するようになっている。

提供状況
Versal AI Coreを搭載した開発キットでソフトウエアの先行開発が可能

 ザイリンクスによれば、現在OEMメーカーなどに対して資料の提供が行なわれており、今年の下半期に開発ツールの提供が開始される予定としている。そしてエンジニアリングサンプルおよび量産シリコンは2022年上半期に提供開始される計画だ。既存のVersal ACAP製品である「Versal AI Core」を搭載した評価キットは提供済みで、それを利用してソフトウエア開発を行ない、Versal AI Edgeの提供開始後にそちらに切り替えて開発を行なうことも可能だ。