写真●複雑な背景の画像から値札の文字列を抽出し、翻訳表示するデモの風景
写真●複雑な背景の画像から値札の文字列を抽出し、翻訳表示するデモの風景
[画像のクリックで拡大表示]

 東芝は2015年4月2日、カメラで撮影した看板や標識、メニューなどの画像から文字列を検出する技術を開発したと発表した。文字認識技術や機械翻訳技術と組み合わせれば、看板をスマートフォンで撮影するだけで、書かれている内容を母国語に翻訳できる。多数の海外旅行者が見込まれる2020年の東京オリンピック開催に向けて、実用化を目指す。

 暗所や逆光といった劣悪な照明条件や、多様な背景の写り込み、撮影位置に起因する文字のゆがみがあっても、高い精度で文字列を抽出できるよう技術を開発した。縦書きの文字列にも対応する。人物検出などで実績のある画像認識技術を応用。3次元的な文字の連結性を考慮することでゆがんだ文字列も高い精度で検出できる。

 用途は外国語の看板やメニューの翻訳に限らない。例えば、保守点検現場で検査対象の製造銘板名にかざすとマニュアルを表示する保守点検作業支援などが考えられるという。