米Googleは米国時間2009年11月19日,同社が運営する動画投稿サイト「YouTube」で,動画再生時に自動で字幕を付ける機能「Auto-caps(automatic captions)」を追加と発表した。

 これまで字幕を表示するには,動画の投稿と同時に字幕を記述したファイルをアップロードしなければならなかった。この方法ではユーザーに負担がかかり,YouTubeにある膨大な動画すべてに字幕を付けるのは困難と判断。機械生成による方法も採用することにした。

 この機能は,同社の自動音声認識技術を利用している。映画などの字幕と同じく人物がまだ話し終えていないセリフもあらかじめ表示する。また字幕は翻訳することもできる。約50の言語に対応しており日本語表示も可能。利用するには,画面右下にあるアイコンにマウスを持っていくと表示される「Transcribe Audio」や「Translate Captions」を選択する。現在のところ対応している言語は英語のみ。UC BerkeleyMITUCTVといった一部のパートナ・チャンネルやYouTubeチャンネルなどが対応している。

 Googleは同時に「Auto-timing」という機能も追加した。面倒な字幕ファイル作成の手間を軽減する。これまでは「キャプション・ファイル」と呼ぶ形式に従って,字幕のテキスト本文と時間コードなどを記述しなければならなかった。これを字幕だけを書いたテキスト・ファイルをアップロードするだけで済むようにした。字幕生成と同じくGoogleの音声認識技術を使って,字幕のタイミングを自動調整する。こちらはまだ英語のみだが,YouTubeのすべての動画が対応している。

 こうした字幕機能は聴覚障害者や外国人だけに役立つものではないとGoogleは説明する。動画の機械翻訳や検索といった技術/サービスの向上にもつながるとしている。

[Google公式ブログへの投稿記事]