ニュース
【GTC Japan 2017】1日1人あたり1409円売り上げアップ。NTTドコモのAIタクシーセッション
ディープラーニングよるタクシー需要予測
2017年12月15日 14:10
- 2017年12月12日~13日 開催
12月14日、NVIDIAが開催した「GTC Japan 2017」において、NTTドコモが「AI タクシー:リアルタイム人口統計データを用いた深層学習によるタクシー需要予測」と題したセッションを行なった。
登壇したNTTドコモ R&Dイノベーション本部 サービスイノベーション部 第2サービス開発担当の石黒慎氏は「ベテランタクシードライバーにヒアリングした結果、新人ドライバーは需要の高いエリアが分からない、ベテランのドライバーは土地勘のないエリアに配送した後、自分の得意エリアに帰ろうとしてしまうことが分かった。このように、必ずしも効率的な運行ができていないのではないかと考えた」と話し、その上でNTTドコモが持つリアルタイム人口データとディープラーニングの技術を組み合わせて将来需要予測を行なうプロジェクトを開始した。
リアルタイム人口データとは、NTTドコモの携帯電話ネットワークの仕組みを利用した動態人工データである。各基地局のエリアごとに所在するNTTドコモの携帯電話の台数を集計し、さらにNTTドコモの普及率を加味することで人口を推計するという仕組みだ。これにより、10分ごとに日本全国の人口を500mグリッドで推定している。
このデータと乗客獲得率データを組み合わせて、過去の実績をもとにした事前検証が行なわれている。これにより、タクシー乗車推移と人口推移が同期する地点と、それが5時間遅れで同期する地点の2パターンがあること、そして普段よりも人口が多い時間・場所では乗客獲得率が高く、人口をもとに需要を発見できる可能性があることが分かったとした。
ディープラーニングを利用した理由として、石黒氏は「ディープニューラルネットワークにより、各特徴量の相関関係を抽象化することが目的だった」と説明し、「高次元の特徴量を生成し、データ間の相関性が不明瞭な場合でも高度な抽象化ができることが考えられる。地点によって人工推移と乗客獲得率にずれが生じる場合でも、ディープニューラルネットワーク上で互いの相関関係が考慮されて表現されるのではないかと期待した」と述べた。
学習に用いられたデータは、リアルタイム人口データやタクシー乗車数、天候といった複数種の時系列データと、同一曜日や同一時間帯の平均乗車数といった統計化された特徴量を組み合わせたもの。学習には、特長の抽出にAutoencoderを用い、ノイズを取り除くように学習するdenoising Autoencodersを積み重ね、教師ありの学習器を組み合わせたStacked denoising Autoencoders(SdA)が使われている。なお予測モデルの設計においては、全体で単一の予測モデルを作成する方法と、場所ごとに異なる予測モデルを作成する方法の2つが考えられたが、今回の実証実験では前者が採用されている。
学習データには2016年4月1日~8月31日のものが使われ、それをもとに2016年9月1日~14日の期間で評価が行われた。対象エリアは東京23区と武蔵野市、三鷹市である。
この実証実験でのオンライン予測結果評価は、正解精度は92.9%に達したとする。また実証実験に参加したタクシードライバーと実験に協力した東京無線全体の売上を比較したところ、平均で1人1日あたり1409円の売上アップが実現したと説明された。
最後に石黒氏は今後の課題として「イベント情報などのデータを追加して学習を行ったり、より高精度な深層学習アルゴリズムを実現していきたいと考えている。そのためにDGX-1をフル活用していきたい。また将来的にはVoltaを使っていきたい」と語った。