イベントレポート

【CES 2019】Nuance Communications、感情を推定することで自動車向け音声認識エンジン「Dragon Drive」の対応を変化

Affectivaの「Emotion AI for Automotive」と連携

2019年1月6日~7日(現地時間) プレスカンファレンス

2019年1月8日~11日(現地時間) 一般公開

感情認識AIであるAffectivaの「Emotion AI for Automotive」と連携するニュアンスの音声認識エンジン「Dragon Drive」

 Nuance Communications(以下、ニュアンス)は、米ラスベガスで開催中の「CES 2019」(1月8日~11日)において、音声によって各種クルマのコントロールなどを行なう、次世代の音声認識システムを展示した。

 ニュアンスは、コンシューマ製品では「ドラゴンスピーチ」などで知られる音声認識エンジンの世界的メーカー。現在力を入れているのが、自動車向け音声認識エンジン「Dragon Drive」で、メルセデス・ベンツの「ハイ、メルセデス(Hi,Mercedes)」もDragon Driveのエンジンが使われているなど、多くの自動車メーカーに採用されている。

 そのニュアンスがCES 2019で展示したシステムの1つが、感情認識をしつつ音声でクルマの各部をコントロールしようというもの。「Close the right window」と言えば、右のウィンドウが閉まるなどの基本的な動作に加え、顔を認識するカメラで感情を推定することで、Dragon Driveの返答を変えていくことなどが可能になるという。これは、ドライバーモニタリングしていることにほかならず、ドライバーが眠くなった際の警告などもDragon Driveがしてくれる。

ニュアンス、Affectivaの「Emotion AI for Automotive」感情認識AI搭載の「Dragon Drive」デモ

 この感情を推定するAI認識には、Affectivaの「Emotion AI for Automotive」という技術が使われており、Dragon Driveと連携させることで実現している。

 そのほかのデモとして、ミニバンの各座席にいる人の発声をそれぞれ認識するというデモを実施。これは、例えば6人乗りであれば、各座席の天井などにマイクを設置。そのマイクから拾った音をシステムが整理し、個別の座席の音を送り返すというものだ。例えば、助手席を指定すると、助手席のマイクから拾った音と、そのほかのマイクから拾った音を演算。助手席のマイクのメインの音(つまり助手席に座っている人の声)を推定し、そのほか後ろの席から聞こえてくる音はミュートする。それをシステムに送り返すことで、クリアな音声を実現できる。

ミニバンタイプの車両でデモを実施。各座席の発話を確実に拾うことができていた

 これは、後部座席で子供が大声で遊んでいるようなときでも、明瞭な音で自動車電話などができ、将来コンシェルジェサービスが普及するときにおいても有用な機能だろう。

 ニュアンスはこのようにDragon Driveの音声認識エンジンを進化させることで、新しい自動車の形を作ろうとしている。

編集部:谷川 潔