図1 画像内の顔の位置を探し、その顔の表情を推定する
図1 画像内の顔の位置を探し、その顔の表情を推定する
[画像のクリックで拡大表示]
図2 ユーザーの表情に応じて機器の動作を変える用途も想定する
図2 ユーザーの表情に応じて機器の動作を変える用途も想定する
[画像のクリックで拡大表示]

 オムロンは2012年10月23日に、人の顔が写った画像データから表情を推定する「表情推定技術」を開発したと発表した(発表資料)。「喜び」「驚き」「恐怖」「嫌悪」「怒り」「悲しみ」「無表情」の7種の表情についてそれぞれの度合いを推定する。

 同社の顔画像センシング技術群「OKAO Vision」の1製品として、ソフトウエアで提供する。CPUコアの動作周波数が1GHz程度のスマートフォンで動作させた場合、顔の位置の検出および表情の推定を30ms以下で実行できるという。

 オムロンは表情推定技術の応用例として、(1)ペット・ロボットを人の表情に応じて行動させる、(2)プリント・シール機で被撮影者の表情に応じて背景画像を変える、(3)写真管理ソフトウエアで特定の表情の写真だけを抽出する、(4)家電製品をユーザーの表情に応じて制御する、といった案を挙げる。

 表情推定技術は、OKAO Visionの中核技術である「3Dモデルフィッティング技術」と「統計的識別手法」に基づく。前者は簡易的な顔の3次元モデルに当てはめて顔の向きや表情の変化を認識する技術、後者は顔などの特定物体ごとの特徴的なパターンを機械学習に基づいて優先順位付けする技術である。今回、オムロンは顔画像に7種の表情ごとの評点を付けたものを「数万枚」(同社)用意し、それを学習データとして用いることで表情推定技術を実現した。

 「ポジティブな感情なのか、ネガティブな感情なのかは、8割程度の正確さで判断できる」(同社)という。人とのやり取りを踏まえて表情の判定基準を動的に調整するといった機能については「今後の開発課題の一つとして検討している」(同社)。