「これまでの画像認識技術は、いわゆる“カメラ”からの映像を利用することを前提としていた。これからは、何らかの認識を目的とした、人の目に見せるための映像を出力しない新しいカメラが登場するだろう」――。2012年8月20日号の特集記事「あらゆるところに賢いカメラ」の取材にご協力いただいた、画像認識関連の複数の研究者がこのようにおっしゃっていました。

 現実世界の情報を取得するためのセンサとしてカメラを使う環境は、かなり整ってきました。カメラ・モジュールが安価になり、顔検出やフレーム間の特徴点照合といった画像認識のアルゴリズムも成熟してきました。AR(augmented reality:拡張現実感)アプリケーションがもてはやされているスマートフォンなどでは、カメラの映像に対して高い追従性を持つ形でそれなりの認識処理を実行できるようになっています。

 さらに、自動車運転支援システムなどに向けた画像認識プロセサが相次いで投入されており、それらが徐々に安価になりそうです。これにより、CPUコア上のソフトウエアで実現していた認識処理を大幅に効率良く実行できるようになります。より高度な認識を実現したり、より低い消費電力で実行したりできるわけです。先月のエディターズ・ノートに書いたように、さまざまな機器がカメラと画像認識機能を備える日は近そうです。

 そうした話題を調べる中で出てきたのが、冒頭の言葉でした。確かに、認識のためのシステムであれば映像の出力は不要です。例えば画像認識技術の先進事例の一つである富士重工業の自動車運転支援システム「EyeSight」も、外部には映像を出力していません。

 将来的には、より高度な認識を行うために、後段の認識処理を前提にカメラそのものの構造を変える可能性がありそうです。現在の画像認識は、明暗差が激しいシーンや、暗いシーンなど環境の変化に弱いという課題があります。これは、可視光映像の出力を第一の目的とする撮像素子を利用している限り、避けることが難しいようです。そこで、撮像手法を変えることへの期待が高まりつつあります。今回の特集の取材では、計算を前提にした撮像技術である「コンピューテーショナル・フォトグラフィ」が、画像認識に応用される兆しが見えてきました。

 記事では、(1)新しい撮像手法の登場によって認識に使える情報が多元化すること、そして(2)安価な画像認識プロセサの登場などによって認識処理の効率が大幅に高まりそうなこと、という二つの動きを解説しました。(1)の動きの象徴ともいえるライト・フィールド・カメラ「Lytro」の内部構造と動作原理も詳しく解説しています。ぜひご覧いただければ幸いです。