Tech-On!は無料登録制の技術情報サイトです。ぜひ会員登録してこの記事の全文をお読みください。 Tech-On!無料登録の説明ページ初めてご利用の方:無料会員登録へ登録に関するご質問登録に関するご質問学生の方:無料会員登録へ ログイン・ページに進むIDやパスワードをお忘れの方は…Cookieが使えない状態になっていませんか?
お薦めトピック
- AD -

Microsoft社,SALT対応の音声アプリ開発環境「.NET Speech SDK」を公開

2002/05/14 12:11
はてなブックマーク
Facebookでシェアする
Twitterでつぶやく
印刷用ページ
 2002年5月7日〜10日に米サンノゼ市で,音声インタフェースの開発者に向けた会議「AVIOS (Applied Voice Input Output Society) Speech Expo」が開催された。そこで注目を集めたのは,米Microsoft Corp.が公開した「.NET Speech SDK version 1.0 beta(.NET Speech SDK)」だった。

 同SDKは,音声やグラフィックスなどを組み合わせたインタフェースを用いてWebアプリケーションを構築するための開発環境である(ニュース・リリース)。同社の開発ツールである「Visual Studio .NET」と共に使う。Microsoft社によると,開発者が音声インタフェースについての特別な知識を持たなくても使える点が特徴という。例えば図1は,同SDKを用いて音声入力またはキーボード入力が可能なフォームを開発しているところである。文字入力のボックスの右側に見える小さなボックスが,SALT(Speech Application Language Tags)を利用する音声関連コマンドの印である。現在,音声対応のWebアプリケーションを構築するにはグラフィックス用と音声用の2つの開発ツールを使わなければならない。「我々の目的は,WWWシステムの開発者が1つのツールでグラフィックスや音声といった複数種のインタフェースを扱えるような環境を整備することにある」(同社 .NET Speech Technologies担当 Director of MarketingのJames Mastan氏)という。

「VoiceXMLに対応する予定はない」
 WWW関連の音声アプリケーションの多くはこれまで,W3C(World Wide Web Consortium)が定めた「VoiceXML」と呼ぶ記述言語を用いて開発されている。これに対して.NET Speech SDKは,Microsoft社や米SpeechWorks International, Inc.などが開発中の「SALT」という記述言語に対応する(NE ONLINEの関連記事)。Microsoft社は「VoiceXMLに対応する予定はない」とする。その理由についてMicrosoft社のMastan氏はこう説明する。「VoiceXMLは主に,一般電話を利用した音声アプリケーションの開発に向いている。WWWシステムの開発者には使いづらい。これはMicrosoft社も自ら音声対応システムの開発から経験したことだ。我々は,より多くのWWWシステム開発者が親しみやすい記述言語を目指してSALTの採用を決めた」。

 しかし今回の会議では,異なる動きもあった。米IBM Corp.が,VoiceXMLの一部を採用した「XHTML+Voice Profile 1.0」仕様を用いて「Pocket PC」搭載のPDA上で動作するマルチモーダルのWebアプリケーションを展示したのだ。展示の担当者は「IBM社は業界標準しか利用しない」と改めて方針を強調していた。なお,Microsoft社も2002年の夏に「SALTをある業界標準団体に提案する予定」としている。

 .NET Speech SDKは現在のところ無料である。Webアプリケーションの音声入力や同出力の動作を設定するツールや,エンド・ユーザーが使える言葉をアプリケーションに応じて限定するための音声グラマー・エディタ,音声プロンプト・エディタ,音声デバッグ用ツール,WWWブラウザ(パソコン向けInternet Explorer)に組み込む試験用プラグインなどを含んでいる。今後も機能強化を進めて,2003年内に正式版を公開するときまでには電話を利用した音声認識機能や,PDA向けの「Pocket Internet Explorer」に対応した音声認識用プラグイン,端末とサーバで音声処理を分担する分散型音声認識機能などを加える予定である。図2に,音声認識を利用したPocket PC用アプリケーションのデモンストレーション画面を示す。左側のマイクロホンの形をしたアイコンをクリックすると,音声によってメニュー操作が可能になる。なお,.NET Speech SDKのバージョン1.0は英語のみ,出荷する時期が未定のバージョン2.0で,日本語や他の言語に対応するという。
(Phil Keys=シリコンバレー支局)

図1:.NET Speech SDKで,音声入力またはキーボード入力が可能なフォームを作成しているところ
図2:音声認識を使うPocket PC用アプリケーションのデモ画面
Tech-On!プレミアム

膨大な記事データベースから、必要な記事を検索し、毎月30ページまで閲覧できる有料オンラインサービスです。(詳細はこちら

イプロスの製品トピックス
English
中文