ニュース

【GTC Japan 2018】パナソニック、ディープラーニングを使った顔認証システム「FacePRO」を解説

複数のディープラーニングを融合して認識率を向上

2018年9月13日~14日 開催

GTC Japan 2018のパナソニックブースに設置された「FacePRO」で使われるインテリジェント監視カメラ

 パナソニックは9月13日、NVIDIAが主催する技術カンファレンス「GTC Japan 2018」(9月13日~14日開催)で「ディープラーニング顔認証システムの進化 ~NVIDIA AIプラットフォームとパナソニック独自アルゴリズムの融合~」と題して、パナソニック コネクティッドソリューションズ社 セキュリティシステム事業部 高桑誠氏が、自社の監視カメラセキュリティシステム「FacePRO」に関する講演を行なった。

パナソニック株式会社 コネクティッドソリューションズ社 セキュリティシステム事業部 高桑誠氏

 パナソニックの顔認証技術は、20年以上前から開発に取り組み、現在ではさまざまなところで使われている。なじみのあるところでは、デジタルカメラで顔を認識してフォーカスや露出を合わせる機能だろう。個人認証として顔認証を使うシーンも多い。監視カメラによる顔認証システムは2011年から販売している。空港、流通、小売り店、高齢者介護施設、スタジアムなどに導入されている。日本では2020年のオリンピックに向けて、ネットワークカメラやそれに関連する画像解析の市場が伸びてきている。

パナソニックの顔認証技術はコンシューマ製品としては、デジカメ、ムービー、TVで使われている
空港ゲートの顔認証でもすでに稼働中
2011年からは監視カメラによる顔認証システムを販売
ネットワークカメラやそれに関連する画像解析の市場は、わずかだが伸びる傾向

 これまでの監視カメラの課題は、逆光や低照度といった厳しい条件、天井に設置されることもありうつむきに弱い、海外ではサングラス着用が多く日本では冬場にマスクで顔を覆われる、年齢による体系の変化、といった要因で顔の認識率が落ちてしまう傾向にあった。これをディープラーニングを活用して認証精度を引き上げたのがFacePROになる。認証だけでなく、撮像に関しても刷新している。

 新開発のディープラーニング顔認識エンジンでは、従来比で2倍以上、斜めやうつむきでの認識率が上がり、サングラス、マスク、経年変化があるという悪条件でも認識ができるようになった。傾向の異なる複数のディープラーニングを融合して使うことで実現している。3万種の顔を登録したうえで、1秒以内の検出を可能としていて、500万の顔の中から3秒以内に特定の顔を検索できる。こういった速度を実現しているのがNVIDIAのGPUとなり、NIST(アメリカ国立標準技術研究所)の評価基準で世界最高水準を達成している。

これまでの監視カメラの弱点
FacePROの特徴
新開発ディープラーニング顔認識エンジンの特徴
傾向の異なる複数のディープラーニングを融合して使っている
NIST(アメリカ国立標準技術研究所)の評価基準で世界最高水準を達成。上に行くほど難易度が高い
NVIDIAの技術を使って実現している

 精度を高めるためには、インテリジェントカメラの部分も重要。同社製のデジタルカメラにも搭載されている、被写体に応じて最適な撮影モードを選択する「インテリジェントオート(iA)」機能と、類似した複数枚の撮影結果から最適な1枚を自動で選択する「ベストショット」機能を搭載し、よりよい条件の写真を得て、さらに顔認証サーバーの負荷を軽減している。ベストショット時には、顔部分のみを自動でトリミングすることも行なっている。

 システムは従来の監視システムを拡張して、顔認証サーバーを追加するなど、柔軟性や拡張性がある。顔認証サーバーの推奨の環境は、GPUがNVIDIA「Quadro P5000」、CPUはIntel XeonまたはCore i7シリーズ3.4GHz以上、OSはWindows Server 2016 Standard Editionとなっている。推奨GPUは、信頼性と導入コストのバランスから考えて決めたとのことだ。

被写体に応じて最適な撮影モードを選択する「インテリジェントオート(iA)」機能を活用
類似した複数枚の撮影結果から最適な1枚を自動で選択する「ベストショット」機能と、顔部分をトリミングしてサーバー負荷を軽減
FacePROの基本的なシステム構成
顔認証サーバーの推奨GPUはNVIDIA「Quadro P5000」
多拠点展開といった拡張性も持つ

 FacePROは会場内でブースを出してデモも行なっていて、実際の動作を確認することもできた。

GTC Japan 2018会場内のパナソニックブース
インテリジェントカメラ
カメラで撮影された会場内のリアルタイム映像
画面下半分がリアルタイムに切り出された顔写真。上が検索により時間軸として表示された顔写真