GTC 2017
【GTC 2017】ホンダ、NVIDIAのGRID技術を利用したエンジニアリングワークステーションの仮想化事例を発表
Tesla M60とNVIDIA GRIDソフトウェアを採用して性能倍、効率20~40%向上
2017年5月10日 18:44
- 2017年5月8日~11日(現地時間)開催
- San Jose McEnery Convention Center
本田技研工業およびその100%子会社で研究開発を行なっている本田技術研究所(以下両社を合わせてホンダ)は、GPUメーカーのNVIDIAが5月8日~11日(現地時間)に米国カリフォルニア州サンノゼ市で開催している「GPU Technology Conference 2017」(GTC 2017)において講演を行ない、同社が進めてきたEWS(エンジニアリングワークステーション)を、NVIDIAが提供するGPU仮想化技術を利用して仮想化する取り組みに関する事例とその成果を発表した。
NVIDIAがGRIDと呼んでいるGPU仮想化技術は、エンジニアの手元にあるGPUを搭載していないPCから、データセンターに置かれているGPUサーバーにアクセスし、まるでGPUがローカルにあるように実行する技術。従来はエンジニアの席に1人あたり1つの高価なハイエンドGPUを搭載したワークステーションPCを置いていたため、高コストかつ利用率が一定していなかったりと効率がよくなかったが、GRID導入後はリソースを効率よく利用することが可能になったという。
GPU仮想化の取り組みを2段階で行なってきた、GPUパススルーからvGPUに進化していく
本田技術研究所 四輪R&Dセンター デジタル開発研究室 CISブロック 研究員の大久保雅司氏は、ホンダのエンジニアリングワークステーションに関する戦略の概要を説明し、「自動車メーカーにとっては、自動車の設計で生産性を向上させることは非常に重要。ホンダはグローバルで26カ所の研究開発施設を持ち、それぞれの施設でエンジニアリングワークステーションを稼働させており、それらの効率を引き上げていくことが課題となっていた」と述べる。
自動車の設計プロセスはほぼ完全にデジタル化されており、各種の解析ソフトウェアを利用してシミュレーションや3D CADを利用しての設計などがどのメーカーでも一般的に利用されるようになっている。そうした時に利用されるのが、EWS(エンジニアリングワークステーション)と呼ばれる、Quadroなどの業務用のGPUが搭載されたワークステーションPCとなる。この時に課題となるのが、ワークステーションPC自体の有効利用だ。
というのも、ワークステーションPCは高価なCPUやGPUが搭載されるため、安いモノでも数十万円、高い場合には3桁万円程度の値段が一般的で、自動車メーカーにとっては費用対効果が問題になっているのだ。また、ワークステーションをエンジニア1人に1つ割り当てると、そのエンジニアが休みを取っている時には単に休んでいるだけになり、効率的なリソースの活用という観点からは課題になりつつあった。
そこでホンダがここまで取り組んできたのが、GPUの仮想化だ。GPUを企業のデータセンターに集約して配置し、クライアントとなるPCから仮想化ソフトウェアを通じて利用する、VDIと呼ばれるソリューションにホンダは取り組んできた。大久保氏が「第1段階の取り組み」と呼んでいるGPUパススルー(仮想マシンと物理GPUを1:1で利用する仮想化の方式)で利用していた時でもリソースを有効活用できるようになり、物理的なワークステーションを利用していた時には1000台のワークステーションを112ラックで運用していたとのことだが、GPUパススルー+VDIの導入により1000VM(Virtual Machine、仮想的なPCのこと)を7ラックだけで運用することが可能になり、94%の物理的なハードウェア削減に成功したと大久保氏は説明した。
ただし、また別の課題も出てきたという。GPUパススルーのGPU仮想化の場合、ユーザーのVMとGPUは1:1でアサインされる。このため、GPUの柔軟な割り当てができず、例えばCADを使っているVMではもっとGPUの処理能力が必要な時に対応することが難しかった。
Tesla M60を利用したGRID導入により性能は2倍に、リソース効率は20~40%向上
ホンダは第2段階として、GPUパススルーからvGPU(VMとGPUの割り当てが1:1ではなく、1:他ないしはその逆を実現できるより柔軟な方法)と呼ばれる、より進んだGPUの仮想化に取り組むことになったのだという。
本田技術研究所 四輪R&Dセンター デジタル開発研究室 CISブロックの高橋有真氏は、「ツールによって利用状況をチェックしており、それによりリソースが足りているのかそうではないのかを判断し、GRIDの設定を変更する」と述べ、ユーザー単位(実際にはVM単位)で、必要なリソースを割り当てていく、そうした取り組みを進めていったと説明する。例えば、CADアプリを使っているVMがもっとリソースを必要としていると分かれば、そちらにリソースを割り当てるといった調整を常に行なっているということだ。
そうしたvGPUによる仮想化を導入するにあたり、GRID K2(Kepler世代)とTesla M60(Maxwell世代)という2つのGPUを検討したという。コスト的にはK2の方が有利だったが、消費電力や性能ではM60の方が上。特に性能面ではK2では1~2VMではM60と大きな変化はなかったそうだが、3~4VMにするとM60の方が高い性能を発揮したということだった。
続いて本田技研工業 IT本部 システム基盤部 HG・栃木ITインフラ課の今野広氏は、Tesla M60ベースのシステム導入には3つの改題があり、1つはホスト側の仕組み、もう1つはグローバルの展開、3つめはストレージだと説明した。今野氏によれば、ホスト側はHPE(HP Enterprise)のApollo r2200を導入したといい、Xeon E5-2667v4×2、256GB DDR4、NVIDIA Tesla M60×1というスペックになっているという。VMware vSphere 6.0で仮想化し、それをWindows 7ベースのPCからVMware Horizon Agent 7.0.1から利用する仕組みになっていたという。
性能が課題になると、ストレージに関しては性能が問題になるところはフラッシュメモリーを導入し、キャパシティが問題になるところはネットストレージと使い分けたとのこと。今野氏によれば、意外と問題だったのは「GPUのドライバーのバージョンが結構重要だった。きちんとVMwareの認証が取れているバージョンなどを使わないと性能が発揮できなかったりした」と説明した。
これらの結果としてシステム全体での性能は200%超上がり、リソースの割り当ての柔軟性は従来はできなかったのに対して、1日で再構築が可能になったのだという。また、リソースの密度も33%超上がり、効率は20~40%上がったという。最後に大久保氏は将来の目標について語り、「今後もチャレンジを続けていきたいが、次の目標はグローバルの開発拠点でも利用できるようにすること」として講演をまとめた。
なお、講演終了後には「CATIA」という名称で知られてきた3D CADソフトウェアの3DEXPERIENCE PLATFORMを提供しているDASSAULT SYSTEMS(ダッソー・システムズ)の担当者がホンダとの共同の取り組みなどについて説明した。