第1部<総論>
撮像手法と演算基盤の進化で
画像認識技術が飛躍

画像認識技術が活躍の場を大きく広げる環境が整いつつある。認識の手掛かりを増やす動きと、認識処理の実行基盤を整備する動きが進むからだ。多様な機器がセンサとしてのカメラを備えるようになり、画像認識の新しい用途が生まれる。

画像認識の進化のスピードが上がる

 あらゆる機器がカメラを備え、世の中の動きを詳しく理解する──。そんな世界が訪れようとしている。画像認識技術が活躍の場を大きく広げる環境が整いつつあるからだ。

 「人が目で認識できることを機械でもできるようにする」という究極の目標に向けて少しずつ進化してきた画像認識技術は、工業用の外観検査、文字/数字の読み取り、顔の検出による撮影支援などに応用された。最近では標識や白線の認識による運転支援、ジェスチャー認識による機器操作などにも広がりつつある。

 画像認識には、コストの問題が常に付きまとってきた。新しいアルゴリズムによって認識対象が増えても、リアルタイム性や認識精度を確保するために高価なハードウエアが必要になることが多いからだ。ASICの開発コストを回収できる見通しが立つ機器や、高価なマイクロプロセサの利用が許容される高額の機器以外には広がりにくかった。

 そうした状況が一変する。認識の手掛かりを増やす動きと、画像認識の処理基盤を整備する動きが同時並行で進むからだ。この結果、これまでカメラを持たなかったような多様な機器が画像認識を前提としたカメラを持ち始め、新たな応用例を生み出す。より人の目に近い認識を実現したり、人の目では分からないことを認識したりできるようになる。

『日経エレクトロニクス』2012年8月20日号より一部掲載

8月20日号を1部買う

第2部<撮像手法>
可視光カメラからの脱却
光学系と撮像素子が変化

カメラが記録した画像を解析するという旧来の画像認識のやり方を変える時が来た。画像認識を前提とした構成を持つカメラの研究が進んでいる。透明物体の認識や超高速撮影など、可能性が一気に広がり始めた。

画像の取得を目的としないカメラへ

 「これまでの画像認識は可視光を捉える、いわゆる『カメラ』からの出力を前提としていた。今後は認識を目的とした新しい撮像系を考えるべきだ」(九州大学 大学院システム情報科学研究院 准教授の長原一氏)──。

 画像から特徴点を抽出し、比較するといった画像認識の基本的なアルゴリズムは成熟した。しかし、光の当たり方や照度などといった環境の変化に弱い、認識させたい物体の写真を大量に集めて機械学習させる必要がある、といった課題も残っている。こうした課題を解決し、撮像という概念を拡張する取り組みが本格化している。

画像の取得は前提としない

 カメラの進化の新しい潮流は、画像の取得のみを目的としないことだ。方向性は二つある。光学系の進化と、撮像素子の進化だ。光学系では、光線の色だけでなく入射位置や方向など被写体のさまざまな光線情報(ライト・フィールド)の取得や、入力画像を符号化する技術の活用などが検討されている。後処理によってさまざまな切り口の画像を抽出できるようにするのが狙いだ。

 撮像素子に関しては、フレーム・レートの高速化や取得できるスペクトラムの拡大、距離情報の取得などの機能を備えるための技術開発が盛んになっている。従来の可視光による静止画や動画だけでは認識できない事象や物体を、手掛かりを増やすことによって認識可能にしようという動きだ。

『日経エレクトロニクス』2012年8月20日号より一部掲載

8月20日号を1部買う

第3部<演算基盤>
画像認識プロセサが身近に
ソフト開発環境も整う

一般的なCPUコアは、ベクトル演算が多い画像認識の処理を苦手とする。半導体メーカーは、これを補うべく認識処理を高効率で実行するプロセサの提供を始めた。各社のアーキテクチャの違いを吸収できるソフト開発・実行環境の議論も進んでいる。

画像認識技術の応用先が拡大する

 機器が画像認識機能を備えるときの障壁になっていたのが、認識処理のコストや消費電力だ。「応用分野にもよるが、ある程度の認識精度を求めるとパソコン向けマイクロプロセサで1G~2GHz程度の演算量になってしまうことも珍しくない」(日本シーバ FAE マネージャの白濱昌之氏)。実際の製品で画像認識技術を利用してきたのは、高価なマイクロプロセサの利用やASICの開発を許容できる業務用機器などの分野が中心だった。

 そうした状況が一気に変わりそうだ。画像認識処理に適した回路を集積した画像認識用プロセサを提供する機運が急速に高まっている上に、ソフトウエア開発環境の整備も進んでいるからだ。画像認識処理を軽量にするアルゴリズムの改良も同時に進む。機器メーカーがコストや消費電力をあまり気にすることなく、高度な画像認識機能を各種の機器に搭載できるようになる。

『日経エレクトロニクス』2012年8月20日号より一部掲載

8月20日号を1部買う

第4部<Lytro徹底解剖>
光線情報を使って焦点自在に
ハードもソフトも独自品の塊

撮影後に自由にピントを変更できるカメラ「Lytro」──。手のひらに収まる小型の筐体に、従来のデジタル・カメラとは一線を画す機能を収めた。ハードウエア構成とソフトウエア・アルゴリズムの両面から解析し、Lytroの実体に迫った。

大量の部品を搭載するLytro

 米Lytro社の「Lytro」は、写真を撮影した後にピントの合う場所を自由に変更できる、これまでにないデジタル・カメラである。撮影した画像は、パソコン用のアプリケーション・ソフトウエアやLytro社の専用Webページなどで閲覧できる。アプリまたはWebブラウザー上に表示した画像の1点を指定すると、その点にピントが合った画像を表示する。

 この機能はどのようにして実現しているのか。本稿ではまず、ハードウエアの分解を通して搭載部品の構成や特徴、特殊とされる撮像系の構造を明らかにする。次いで、京都産業大学 教授の蚊野浩氏が動作原理とアルゴリズムの工夫を詳説する。

『日経エレクトロニクス』2012年8月20日号より一部掲載

8月20日号を1部買う