連載第4回の今回は、音声をコンテンツとして扱う用途である、話し言葉を書き起こすシステムを取り上げる。人と人が話す場合の音声認識は非常に難しいが、放送ニュースや国会の審議など、話者がある程度丁寧に話す用途では実用になり始めた。著者が実際に開発したシステムの事例をひもときながら、現在の実力と課題を整理する。(本誌)