日立製作所は、性別や服装、持ち物などの情報を用いて、探したい人物を映像からリアルタイムに検出し、追跡できる技術を開発した。監視カメラの映像から不審者や迷子の居場所を特定するなど、警備や防犯システムでの活用を見込む。2018年度内の事業化を目指す考えだ。

日立製作所が開発した2つの技術。
日立製作所が開発した2つの技術。
[画像のクリックで拡大表示]

 今回日立製作所が開発した技術は2つある。まず、性別や服装、持ち物など見た目に関する既知の情報を基に、映像の中から該当する人を検出する「高速人物発見技術」。そして、特定の個人を映像の中から探して追跡する「高速人物追跡技術」である。これらを組み合わせて、例えば「緑の上着とジーンズを着用した男性」といった情報を基に、監視カメラの映像から対象となる人物を検出し、追跡できるという。いずれもディープラーニング(深層学習)を活用する。

識別できる12種類の属性の内容。性別や年齢、服装や持ち物など、合計100項目以上を識別できるという。
識別できる12種類の属性の内容。性別や年齢、服装や持ち物など、合計100項目以上を識別できるという。
[画像のクリックで拡大表示]

 高速人物発見技術は、画像の中から検出した人について12種類の属性をタグ付けすることで、属性に基づいて探したい人を検索できる技術である。12の属性は、性別、年齢層、装飾品、髪型、服装、持ち物など。例えば「Tシャツ」「ジーンズ」などの服の種類や色、マスクや帽子などの装飾品の有無、バッグパックや傘などを持っているかどうかなど、合計で100項目以上を判別できる。1人の人物について複数の属性をタグ付けすることで、探したい人物を絞り込みやすくなるという。

 全ての属性をリアルタイムにタグ付けするため、識別機の構造に工夫を凝らした。具体的には画像を1つのDNNに入力し、各属性をまとめて識別することで、それぞれの属性ごとに学習した複数のDNNを併用する場合よりも処理時間を約40分の1(約20m秒)に削減した。

「高速人物発見技術」は、性別や年齢、服装など12種類の属性を画像から高速に識別する。
「高速人物発見技術」は、性別や年齢、服装など12種類の属性を画像から高速に識別する。
[画像のクリックで拡大表示]

 DNNは2段階構造で、前段の深いネットワークで人の全体的なシルエットや色合いといった大まかな特徴を、後段の浅いネットワークで各項目を識別するための詳細な特徴を抽出する。最終層での出力が各項目への適合度合いを示す確信度となり、この値に基づいてタグ付けする。

高速人物発見技術のデモ画面。検出した全ての人について、該当する項目とその確信度を表示している。例えば、「30歳未満の女性で、髪の色は黒。上下ともにカジュアルな服装で、上半身の服は長袖。靴の色は黒」とタグ付けした例が見てとれる。
高速人物発見技術のデモ画面。検出した全ての人について、該当する項目とその確信度を表示している。例えば、「30歳未満の女性で、髪の色は黒。上下ともにカジュアルな服装で、上半身の服は長袖。靴の色は黒」とタグ付けした例が見てとれる。
[画像のクリックで拡大表示]