日立製作所は、性別や服装、持ち物などの情報を用いて、探したい人物を映像からリアルタイムに検出し、追跡できる技術を開発した。監視カメラの映像から不審者や迷子の居場所を特定するなど、警備や防犯システムでの活用を見込む。2018年度内の事業化を目指す考えだ。
今回日立製作所が開発した技術は2つある。まず、性別や服装、持ち物など見た目に関する既知の情報を基に、映像の中から該当する人を検出する「高速人物発見技術」。そして、特定の個人を映像の中から探して追跡する「高速人物追跡技術」である。これらを組み合わせて、例えば「緑の上着とジーンズを着用した男性」といった情報を基に、監視カメラの映像から対象となる人物を検出し、追跡できるという。いずれもディープラーニング(深層学習)を活用する。
高速人物発見技術は、画像の中から検出した人について12種類の属性をタグ付けすることで、属性に基づいて探したい人を検索できる技術である。12の属性は、性別、年齢層、装飾品、髪型、服装、持ち物など。例えば「Tシャツ」「ジーンズ」などの服の種類や色、マスクや帽子などの装飾品の有無、バッグパックや傘などを持っているかどうかなど、合計で100項目以上を判別できる。1人の人物について複数の属性をタグ付けすることで、探したい人物を絞り込みやすくなるという。
全ての属性をリアルタイムにタグ付けするため、識別機の構造に工夫を凝らした。具体的には画像を1つのDNNに入力し、各属性をまとめて識別することで、それぞれの属性ごとに学習した複数のDNNを併用する場合よりも処理時間を約40分の1(約20m秒)に削減した。
DNNは2段階構造で、前段の深いネットワークで人の全体的なシルエットや色合いといった大まかな特徴を、後段の浅いネットワークで各項目を識別するための詳細な特徴を抽出する。最終層での出力が各項目への適合度合いを示す確信度となり、この値に基づいてタグ付けする。