ニュース

【GTC Japan 2017】1日1人あたり1409円売り上げアップ。NTTドコモのAIタクシーセッション

ディープラーニングよるタクシー需要予測

川添貴生

2017年12月15日 14:10

2017年12月12日～13日開催

株式会社NTTドコモ R＆Dイノベーション本部サービスイノベーション部第2サービス開発担当石黒慎氏

　12月14日、NVIDIAが開催した「GTC Japan 2017」において、NTTドコモが「AI タクシー：リアルタイム人口統計データを用いた深層学習によるタクシー需要予測」と題したセッションを行なった。

　登壇したNTTドコモ R＆Dイノベーション本部サービスイノベーション部第2サービス開発担当の石黒慎氏は「ベテランタクシードライバーにヒアリングした結果、新人ドライバーは需要の高いエリアが分からない、ベテランのドライバーは土地勘のないエリアに配送した後、自分の得意エリアに帰ろうとしてしまうことが分かった。このように、必ずしも効率的な運行ができていないのではないかと考えた」と話し、その上でNTTドコモが持つリアルタイム人口データとディープラーニングの技術を組み合わせて将来需要予測を行なうプロジェクトを開始した。

検証にあたっては、石黒氏が新人ドライバーに扮してベテランドライバーにヒアリングを行なった

研究目的はリアルタイム人口データとタクシー運行データによる高精度な予測の確認

　リアルタイム人口データとは、NTTドコモの携帯電話ネットワークの仕組みを利用した動態人工データである。各基地局のエリアごとに所在するNTTドコモの携帯電話の台数を集計し、さらにNTTドコモの普及率を加味することで人口を推計するという仕組みだ。これにより、10分ごとに日本全国の人口を500mグリッドで推定している。

　このデータと乗客獲得率データを組み合わせて、過去の実績をもとにした事前検証が行なわれている。これにより、タクシー乗車推移と人口推移が同期する地点と、それが5時間遅れで同期する地点の2パターンがあること、そして普段よりも人口が多い時間・場所では乗客獲得率が高く、人口をもとに需要を発見できる可能性があることが分かったとした。

リアルタイム人口データの概要

拠点によるタクシー乗車推移と人口推移の同期の違い

普段よりも人口が多いと乗客獲得率が高い傾向がある

　ディープラーニングを利用した理由として、石黒氏は「ディープニューラルネットワークにより、各特徴量の相関関係を抽象化することが目的だった」と説明し、「高次元の特徴量を生成し、データ間の相関性が不明瞭な場合でも高度な抽象化ができることが考えられる。地点によって人工推移と乗客獲得率にずれが生じる場合でも、ディープニューラルネットワーク上で互いの相関関係が考慮されて表現されるのではないかと期待した」と述べた。

　学習に用いられたデータは、リアルタイム人口データやタクシー乗車数、天候といった複数種の時系列データと、同一曜日や同一時間帯の平均乗車数といった統計化された特徴量を組み合わせたもの。学習には、特長の抽出にAutoencoderを用い、ノイズを取り除くように学習するdenoising Autoencodersを積み重ね、教師ありの学習器を組み合わせたStacked denoising Autoencoders（SdA）が使われている。なお予測モデルの設計においては、全体で単一の予測モデルを作成する方法と、場所ごとに異なる予測モデルを作成する方法の2つが考えられたが、今回の実証実験では前者が採用されている。