富士通、運転中でも音声だけで情報を取得できる技術

富士通研究所

2011年10月13日公開



 富士通は10月13日、神奈川県川崎市の富士通研究所で研究開発戦略説明会を開催し、「音声だけで最新情報をスマートフォンから取得できる技術」を公開した。

 この技術は、スマートフォンの画面を見ることなく、音声でさまざまな情報を得ることができる技術。2012年度中の実用化を目指す。

 展示された例では、運転中にスマートフォンがニュースのヘッドラインを読み上げ、その中でドライバーが気になったキーワード(例えば「工業団地」)と発声すると、そのキーワードが含まれるニュースを読み上げる。また「天気」と発声すれば現在地周辺の天気を、「京都の天気」のように地域を指定するとその地域の天気を読み上げる。さらに、「ガソリンスタンド」と発声すると、周辺のガソリンスタンドまでの距離、価格などを読み上げる。

 これにより、運転中でも音声だけで欲しい情報を得ることができる。

デモで用意された車両シフトレバーの左前に設置されたスマートフォンでデモが行われた
「ガソリンスタンド」と発声すると、サーバーに接続し、ガソリンスタンドの情報を受け取り、読み上げる

 

デモの様子(2分25秒)

 

音声認識/合成技術について説明した同研究所スピーチ&ランゲージテクノロジ研究部の福岡俊之部長

 音声認識や音声合成は、スマートフォンが接続しているサーバーで行われる。

 音声認識と音声合成の精度を上げるため、サーバー上でインターネットから最新の時事用語を自動取得/解析し、音声認識/合成に使われる辞書を更新する仕組みを備えた。

 また、過去のやりとりを解析し、話題にフォーカスした単語を抽出、音声認識辞書を動的に作成する技術も搭載。実例ではニュースのヘッドライン内の単語から音声認識辞書を作成し、同音異義語などによる間違いを防ぐ。

 さらに、サーバーとのやり取りにかかる時間を、音声データの分割や先読み、無音状態の隠蔽などで意識させないようにし、体感的なレスポンスを改善した。

 同社が提供している位置情報クラウドサービス「SPATIOWL」(スペイシオウル)の音声機能として、渋滞情報をはじめとする様々な情報を提供する、といった用途が考えられると言う。

「音声だけで最新情報をスマートフォンから取得できる技術」でできること。運転中だけでなく、スマートフォンを操作できないお年寄りや、歩きながら情報を得たいときなどにも有効読み上げ、聞き取りの精度向上と、意図どおりの応答、レスポンス向上が開発の課題インターネット上の時事用語を抽出し、読み上げと聞き取りの精度向上を図った
過去のやりとりを考慮して、応答の正確性を向上処理や遅延の時間を隠蔽して、体感的なレスポンスを向上した運転中もWebサイトの情報を音声で受け取ることができる
進行方向のガソリンスタンドの情報を音声で教えてくれる博物館などの音声ガイダンスがインタラクティブになる位置情報クラウドサービス「SPATIOWL」の機能として、2012年に実用化を目指す

(編集部:田中真一郎)
2011年 10月 14日