ニュース

自動運転向けエッジAIの半導体を提供するBlaize、日本での営業開始

NVIDIAのXavierと比較してシステムの効率は15倍で、消費電力は5分の1とアピール

2020年11月5日 発表

Blaizeが提供するGSP、低遅延でメモリアクセスを減らすことで高い電力効率を実現する(出典:性能・効率を追求したAIエッジ・コンピューティング、Blaize)

 米国のAIソリューションを提供するBlaizeは11月5日、オンラインで記者会見を開催し、エヌエスアイテクスを販売代理店として日本での営業活動などを開始することを明らかにした。

 Blaizeは、インテルやNVIDIAなどで半導体の開発に携わったエンジニアが創業したAI向けの半導体やソフトウェアを提供するベンチャー企業で、同社がGSP(グラフ・ストリーミング・プロセッサ)と呼んでいるエッジAI向けの専用半導体とそれを利用するソフトウェアを、自動車メーカーやティアワンの部品メーカーなどに提供している。

 Blaize CEO ディナカー・ムナガラ氏は「GPUでは顧客が必要とする電力あたりの性能やコストを満たすことができない」と述べ、NVIDIAなどが提供しているGPUを利用してエッジAIの推論を行なう場合に比べ、低コストかつ低消費電力で同じ性能を実現できるとアピールした。

エッジAI時代には、CPUやGPUではない最適なAIソリューションが必要になる

Blaize CEO ディナカー・ムナガラ氏

 記者会見の冒頭に登壇したBlaize CEO ディナカー・ムナガラ氏は、同社の概要や特徴などを紹介した。ムナガラ氏によれば、同社はインテルやNVIDIAといった半導体メーカーで働いていたエンジニアなどにより創業された企業。同社のWebサイトで幹部の経歴を見ると、ムナガラ氏自身もそうなのだが、PCに一般的に使われているインテルのプロセッサに内蔵されている内蔵GPUのアーキテクトだったりプログラマだったりと、GPUに精通している人達により作られた会社という形になる。今回の発表会では、エヌエスアイテクスを販売代理店として日本での本格的な営業を行なっていくことが明らかにされ、エヌエスアイテクス 最高技術責任者(CTO)の杉本英樹氏がビデオで両社の提携に関して歓迎のコメントを寄せた。

株式会社エヌエスアイテクス 最高技術責任者(CTO)杉本英樹氏(出典:性能・効率を追求したAIエッジ・コンピューティング、Blaize)

 ムナガラ氏によれば「現在従業員は300名前後で、デンソー、ダイムラー、マグナ、サムスンといった業界のキープレイヤーに出資していただいている。今年の第4四半期には量産を開始する計画であるほか、顧客とPoC(Proof of Concept、概念実証、半導体を利用して実際に製品が実現可能であるかを検証すること)を行なっている段階になる」と、すでに提供する半導体の生産開始に近づいており、顧客と実際に製品の試作を始めている段階だとした。

Blaizeの概要(出典:性能・効率を追求したAIエッジ・コンピューティング、Blaize)

 ムナガラ氏は「今、AIの利用はデータセンターからエッジへと移行が進みつつある。そうした中で、GPUでは実現できないエッジAIに特化したようなニーズを満たす製品が必要だと考えた。CPUやGPUでは必要とする性能を得るには電力が大きすぎで、コストも高い。今後エッジAIを実現していくにはそれに適した製品が必要になると考えており、顧客が必要とするようなソリューションを提供していきたいと考えている」と述べ、今後自動運転車のようなエッジ側で必要となるAIには、汎用に利用されるCPUやGPUではなく、消費電力の面でも性能の面でも、エッジAIに特化したような同社のソリューションが必要になると強調した。

エッジAIには新しいアプローチが必要(出典:性能・効率を追求したAIエッジ・コンピューティング、Blaize)

16コアで16TOPSの性能を7Wで実現するGSPとソフトウェア開発キットをソリューションとして提供

Blaize ストラテジック・ビジネス・デベロップメント担当副社長 リチャード・テリル氏

 Blaize ストラテジック・ビジネス・デベロップメント担当副社長 リチャード・テリル氏は、同社が提供するエッジAI向けのソリューションに関して説明した。テリル氏によれば、同社が提供するのはGSP(グラフ・ストリーミング・プロセッサ)と呼ばれるAIの推論に特化した半導体製品と、それを利用するためのソフトウェア製品群だという。

GSPの仕組み(出典:性能・効率を追求したAIエッジ・コンピューティング、Blaize)

 同社によれば、GSPはエッジ側でのデイープラーニングの推論処理などに特化したプロセッサ。CPUやGPUが複数の画像などを処理する場合には、逐次的に処理していくことになるので、そのたびにデータを置いておくメモリへのアクセスが発生する。しかし、GSPではそのプロセスを並列に処理してプロセッサの中でデータのやりとりを行なうことで、外部メモリへのアクセスをできるだけ減らすことができる。これにより、GPUなどを利用する場合に比べて高性能で、かつ低消費電力で処理することが可能になるのだ。

GSPは1チップ(16コア)で16TOPSを実現し、消費電力は7W(出典:性能・効率を追求したAIエッジ・コンピューティング、Blaize)

 テリル氏によれば、「GSPでは16コア構成で、わずか7Wの消費電力で16TOPSを実現することができる。これはGPUなどほかのソリューションに比較して60倍の効率になっている」と述べ、高効率がGSPの特徴だと強調した。

 そうしたGSPを採用したソリューションとして、Blaizeはボード単体(SoM)製品となるPathfinder P1600、システムにアクセラレータとしてアドオンするXplorerアクセラレータ(X1600E EDSFFとX1600P PCIe)という3製品を提供していくという。

Pathfinder P1600(出典:性能・効率を追求したAIエッジ・コンピューティング、Blaize)

 Pathfinder P1600は組み込み向けのボードにGSP、メモリ、さらには各種I/O(イーサネットやUSBなど)を1つのモジュールにした製品で、クレジットカードよりも小さいサイズで提供される。GSPを16コア搭載しており、16TOPSの性能を実現している。ネットワーク機器やエッジデバイスでの利用が考慮されている。

Xplorerアクセラレータ(出典:性能・効率を追求したAIエッジ・コンピューティング、Blaize)

 Xplorer X1600E EDSFFはPCI Express 3.0 x4のインターフェースを持ち、サーバーなどに組み込んで利用することが意識されている製品。やはりGSPを16コア備えており、16TOPSの性能を実現している。

 Xplorer X1600P PCIeはPCI Expressの拡張カードの形状をしており、デスクトップPCやサーバーなどに組み込んで利用することができる。GSPコアは16~64コアまで対応できるようになっており、性能は16~64TOPSとなっている。

ソフトウェア開発環境(出典:性能・効率を追求したAIエッジ・コンピューティング、Blaize)

 テリル氏は「AIの開発ではソフトウェア開発ツールが重要になる。われわれはそうしたソフトウェア開発キットの充実に力を入れAI StudioとPicasso SDKを提供しており、顧客から2年にわたり評価されている」と述べ、AI向け半導体で重要になるソフトウェア開発キットに関しても力を入れていると強調した。

 テリル氏によればPicasso SDKが従来型のソフトウェア開発キットで、そうした開発キットでのソフトウェア開発に慣れているプログラマ向けに提供している。ユニークなのはAI Studioで、こちらはビジュアル的なツールを利用して手軽にAIプログラムを作れるツールで、より容易に、かつ手軽にAIプログラムを構築することができるようになるとした。

NVIDIAのXavierと比較して効率は15倍になるが、消費電力は5分の1になるとアピール

Blaize フィールド・アプリケーション・エンジニア 小林達也氏

 Blaize フィールド・アプリケーション・エンジニア 小林達也氏は、そうしたBlaizeのソリューションを説明した。小林氏は「自動車はBlaizeのGSPにとって重要なアプリケーション。OEMメーカーやティアワンの部品メーカーに対して採用を呼びかけており、1つのチップで複数の機能をカバーすることが可能になり、自動車の厳しい要求にも対処することができる」と述べ、特に電力効率の点でGPUやFPGAといった現在自動運転車向けに採用されている半導体製品に対するアドバンテージがあるとアピールした。

自動車に最適(出典:性能・効率を追求したAIエッジ・コンピューティング、Blaize)
Xavierとの比較(出典:性能・効率を追求したAIエッジ・コンピューティング、Blaize)
Helm.aiの事例(出典:性能・効率を追求したAIエッジ・コンピューティング、Blaize)

 その具体的な例としてPathfinder P1600とNVIDIAのXavierとの比較を紹介し、同じ性能であればシステムの効率は15倍で、消費電力は5分の1になり、より高い電力効率と低コストを実現すると述べた。そしてHelm.aiが提供しているレベル2+およびレベル3の自動運転を実現する製品について紹介して、6台のカメラからの映像を50MS以下の低遅延で処理するシステムを実現しながら、GPUを利用したソリューションに比較して50%以上のコスト削減と80%以上の電力削減が実現できると説明した。

各種事例(出典:性能・効率を追求したAIエッジ・コンピューティング、Blaize)

 また、このほか複数台カメラによる物体検出事例、人間とロボットの動きを検出する事例、スマートシティでの人や車両の動きを検出する事例、リテールでのセキュリティ事例、センサーフュージョン事例、宅配での事例などの複数の事例が紹介された。