ニュース

富士通テン、英語版「対話型音声認識カーナビ」の試作機を開発

膨大な発話辞書データベースを用い、実行結果や検索結果を自然な発話で応答

英語版「対話型音声認識カーナビ」の試作機
2014年2月17日発表

音声認識、意味理解、音声合成の解析は外部プラットフォームを利用。話者の発話内容や意図を推定する意味理解の部分にはイナゴの「netpeople」技術が使われ、独自のゴール共有型会話機能、文脈把握技術、自然言語理解技術等によってユーザーとの対話を通してやりたいことの意図を汲み取り、積極的に質問をしながらユーザーが欲しい情報を絞り込んでいくアシストを行うという

 富士通テンは2月17日、スマートフォンの専用アプリケーションを使い、センターサーバーにつないで検索する英語版「対話型音声認識カーナビ」の試作機を開発したと発表した。この試作機は、スペインで開催される携帯電話関連展示会「Mobile World Congress 2014」(会期:2月24日~27日)に参考出展される。

 同社はスマートフォンアプリ「CarafL(カラフル)」を使い、センターサーバーとの音声対話型エージェント検索を可能にしたカーナビを国内で展開しているが、新たに英語に対応した試作機を開発した。

 普段使う自然な言葉で話しかけると検索結果を音声で返し、そのまま目的地に設定することができるというもの。会話の中で条件を加えると、文脈を理解して再検索することも可能とした。また、音声だけで知りたい情報を絞り込んでいけるので、画面表示を確認するための視線移動を減らすことができ、安全運転に寄与するとしている。

 音声対話に必要な処理はすべてセンターサーバーで行われる。このセンターサーバーを用いることで、「音声認識の前処理として必要な発話区間抽出や、車載環境固有のノイズ除去を高精度に実行」「膨大な認識辞書データベースを活用した、自然発話形式での音声認識を実現」「高度な意味理解、推論エンジンを用い、話者の発話内容や意図を推定」「様々なコンテンツや、最新かつリアルタイムの情報を用い、話者の要求に応じた処理を実行」「膨大な発話辞書データベースを用い、実行結果や検索結果を、自然な発話で応答」といった特長を実現している。

対話の例

D:ドライバー、A:エージェント

D:Find me a Italian restaurant around here.
(この辺でイタリアン料理が食べられるところを探して)
A:Here is what I found. There is “XXXX” in 0.3 miles from the current location.
(検索しました。現在地から0.3マイル先に“XXXX”があります。)

D:I've changed my mind. I'll take Spanish instead of that.
(やっぱりスペイン料理が食べたいんだけど。)
A:Here is what I found. There is “YYYY” in 1.2 miles from the current location.
(検索しました。現在地から1.2マイル先に“YYYY”があります。)

D:Navigate me.
(そこに案内して)
A:Sent destination to Car Navigation.
(カーナビゲーションに目的地を設定しました)

(編集部:小林 隆)