日立製作所 中央研究所は,テレビ番組などの映像中に表示されたテロップの文字を認識する技術を開発した。認識した結果を使ってテロップの文字を検索可能にすることで,ユーザーが見たいシーンを素早く探し出せるようにする狙い。テロップの文字を認識する技術はこれまでもあったが,同じ行の中で文字の色や明暗が変わったり,文字と枠や図形が混在したりする場合などに,認識が難しかったという。今回の技術を使えば,このような場合でも実用的な認識率を実現できるとした。実用化の時期などは未定。技術の詳細は,3月18~21日に開催される電子情報通信学会 2008年総合大会で発表する。

 開発した技術を,スポーツ映像など約8時間分の映像に適用し,テロップから人名を認識する実験をした。その結果,329カ所のテロップで人名があると判断し,そのうち93%で人名を正しく判定できた。実験に使用した映像はMPEG-2で符号化したもので,文字の抽出や認識はパソコンで実行した。入力した画像からテロップの文字を認識して人名の候補と照合する一連の処理を,約400Mクロック・サイクルで実行できるという。必要な主記憶容量は20Mバイト程度とした。

 テロップの文字の認識は4段階に分けて実行する。(1)まず,映像中からテロップを含む矩形領域を抽出する。(2)次に,そこから行ごとに文字列の領域を切り出す。(3)一行分の文字列の領域を,一文字ごとの領域に分割し,それぞれの領域で文字を抽出する。(4)抽出した文字列と,あらかじめ用意したキーワードのリストを照合して,望みの文字が含まれるかどうかを判別する。今回新たに開発したのは,主に(2)と(3)の部分。(2)では,切り出した領域の中で,文字ではない図形などを排除する工夫を施した。(3)では,文字列全体ではなく一文字ごとに処理することで,同じ行の中で文字の色や明暗が大きく変わる場合でも,適切に文字を抽出できるようにした。

この記事を英語で読む