ニュース

【GTC Japan 2017】1日1人あたり1409円売り上げアップ。NTTドコモのAIタクシーセッション

ディープラーニングよるタクシー需要予測

2017年12月12日~13日 開催

株式会社NTTドコモ R&Dイノベーション本部 サービスイノベーション部 第2サービス開発担当 石黒慎氏

 12月14日、NVIDIAが開催した「GTC Japan 2017」において、NTTドコモが「AI タクシー:リアルタイム人口統計データを用いた深層学習によるタクシー需要予測」と題したセッションを行なった。

 登壇したNTTドコモ R&Dイノベーション本部 サービスイノベーション部 第2サービス開発担当の石黒慎氏は「ベテランタクシードライバーにヒアリングした結果、新人ドライバーは需要の高いエリアが分からない、ベテランのドライバーは土地勘のないエリアに配送した後、自分の得意エリアに帰ろうとしてしまうことが分かった。このように、必ずしも効率的な運行ができていないのではないかと考えた」と話し、その上でNTTドコモが持つリアルタイム人口データとディープラーニングの技術を組み合わせて将来需要予測を行なうプロジェクトを開始した。

検証にあたっては、石黒氏が新人ドライバーに扮してベテランドライバーにヒアリングを行なった
研究目的はリアルタイム人口データとタクシー運行データによる高精度な予測の確認

 リアルタイム人口データとは、NTTドコモの携帯電話ネットワークの仕組みを利用した動態人工データである。各基地局のエリアごとに所在するNTTドコモの携帯電話の台数を集計し、さらにNTTドコモの普及率を加味することで人口を推計するという仕組みだ。これにより、10分ごとに日本全国の人口を500mグリッドで推定している。

 このデータと乗客獲得率データを組み合わせて、過去の実績をもとにした事前検証が行なわれている。これにより、タクシー乗車推移と人口推移が同期する地点と、それが5時間遅れで同期する地点の2パターンがあること、そして普段よりも人口が多い時間・場所では乗客獲得率が高く、人口をもとに需要を発見できる可能性があることが分かったとした。

リアルタイム人口データの概要
拠点によるタクシー乗車推移と人口推移の同期の違い
普段よりも人口が多いと乗客獲得率が高い傾向がある

 ディープラーニングを利用した理由として、石黒氏は「ディープニューラルネットワークにより、各特徴量の相関関係を抽象化することが目的だった」と説明し、「高次元の特徴量を生成し、データ間の相関性が不明瞭な場合でも高度な抽象化ができることが考えられる。地点によって人工推移と乗客獲得率にずれが生じる場合でも、ディープニューラルネットワーク上で互いの相関関係が考慮されて表現されるのではないかと期待した」と述べた。

 学習に用いられたデータは、リアルタイム人口データやタクシー乗車数、天候といった複数種の時系列データと、同一曜日や同一時間帯の平均乗車数といった統計化された特徴量を組み合わせたもの。学習には、特長の抽出にAutoencoderを用い、ノイズを取り除くように学習するdenoising Autoencodersを積み重ね、教師ありの学習器を組み合わせたStacked denoising Autoencoders(SdA)が使われている。なお予測モデルの設計においては、全体で単一の予測モデルを作成する方法と、場所ごとに異なる予測モデルを作成する方法の2つが考えられたが、今回の実証実験では前者が採用されている。

需要予測にはディープラーニングが用いられた
時系列と統計量データをSdAに入力し、抽象化した特徴量を用いて回帰予測を行なう
タクシーと人口のそれぞれで長短期のトレンドを把握するため、各種統計量を特徴量として設計
2種類の予測モデル
30分先の500mグリッドごとのタクシー乗車台数を10分ごとに予測

 学習データには2016年4月1日~8月31日のものが使われ、それをもとに2016年9月1日~14日の期間で評価が行われた。対象エリアは東京23区と武蔵野市、三鷹市である。

 この実証実験でのオンライン予測結果評価は、正解精度は92.9%に達したとする。また実証実験に参加したタクシードライバーと実験に協力した東京無線全体の売上を比較したところ、平均で1人1日あたり1409円の売上アップが実現したと説明された。

利用したデータごとの予測精度の比較
乗車数が多い地域では、リアルタイム人口データを加えることで予測精度が向上した
場所および時間帯による乗車実績の違いによって、予測精度に差が生じたとする
オンラインでの需要推定にはドコモのクラウドが使われた
予測の正解精度は92.9%に達した
実証実験に参加したタクシードライバーと全体平均の売上の差

 最後に石黒氏は今後の課題として「イベント情報などのデータを追加して学習を行ったり、より高精度な深層学習アルゴリズムを実現していきたいと考えている。そのためにDGX-1をフル活用していきたい。また将来的にはVoltaを使っていきたい」と語った。