富士通、運転中でも音声だけで情報を取得できる技術 |
富士通は10月13日、神奈川県川崎市の富士通研究所で研究開発戦略説明会を開催し、「音声だけで最新情報をスマートフォンから取得できる技術」を公開した。
この技術は、スマートフォンの画面を見ることなく、音声でさまざまな情報を得ることができる技術。2012年度中の実用化を目指す。
展示された例では、運転中にスマートフォンがニュースのヘッドラインを読み上げ、その中でドライバーが気になったキーワード(例えば「工業団地」)と発声すると、そのキーワードが含まれるニュースを読み上げる。また「天気」と発声すれば現在地周辺の天気を、「京都の天気」のように地域を指定するとその地域の天気を読み上げる。さらに、「ガソリンスタンド」と発声すると、周辺のガソリンスタンドまでの距離、価格などを読み上げる。
これにより、運転中でも音声だけで欲しい情報を得ることができる。
デモで用意された車両 | シフトレバーの左前に設置されたスマートフォンでデモが行われた |
「ガソリンスタンド」と発声すると、サーバーに接続し、ガソリンスタンドの情報を受け取り、読み上げる |
デモの様子(2分25秒) |
音声認識/合成技術について説明した同研究所スピーチ&ランゲージテクノロジ研究部の福岡俊之部長 |
音声認識や音声合成は、スマートフォンが接続しているサーバーで行われる。
音声認識と音声合成の精度を上げるため、サーバー上でインターネットから最新の時事用語を自動取得/解析し、音声認識/合成に使われる辞書を更新する仕組みを備えた。
また、過去のやりとりを解析し、話題にフォーカスした単語を抽出、音声認識辞書を動的に作成する技術も搭載。実例ではニュースのヘッドライン内の単語から音声認識辞書を作成し、同音異義語などによる間違いを防ぐ。
さらに、サーバーとのやり取りにかかる時間を、音声データの分割や先読み、無音状態の隠蔽などで意識させないようにし、体感的なレスポンスを改善した。
同社が提供している位置情報クラウドサービス「SPATIOWL」(スペイシオウル)の音声機能として、渋滞情報をはじめとする様々な情報を提供する、といった用途が考えられると言う。
(編集部:田中真一郎)
2011年 10月 14日