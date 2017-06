図1 パナソニックのTakeshi Yukitake氏 [画像のクリックで拡大表示] 図2 自動翻訳システムの構造 [画像のクリックで拡大表示]

半導体(VLSI)関連の国際会議「2017 Symposium on VLSI Technology and Circuits」が京都で開幕した。2017年6月6日に開催された基調講演セッション「Plenary Session」では、パナソニックのTakeshi Yukitake氏(Connected Solutions Company)が「Innovative solutions toward future society with AI, Robotics, and IoT」と題して講演した。



パナソニックの同氏は、革新的な技術によってもたらされる将来の社会像として、以下の3つを挙げた。(1)ボーダーレスなコミュニケーションが可能な社会、(2)人間とロボットが共生する社会、(3)安全でセキュアなネットワーク社会、である。(1)は、人間の意志やアイデアを認識し予測できる社会で、主に人工知能(AI)によってもたらされる。(2)は、ハイレベルな業務をロボットが担ったり、人間をサポートしたりする社会で、主にロボティクス技術によって実現される。(3)は、人間同士を有機的に結び付ける社会で、IoT(Internet of Things)技術の進展がこれを後押しする。



このうち、(1)の「ボーダーレスなコミュニケーションが可能な社会」の実現に向けては、今後解決すべき課題がいくつかあるとした。例えば、言語ギャップや、現状では十分にユーザーフレンドリーではないデバイス、などである。今回、パナソニックの同氏は、言語ギャップの解消に向けてパナソニックが開発中の多言語翻訳技術を紹介した。2020年の東京五輪(パラリンピック)をターゲットにしている技術という。



具体的な例として、駅やパブリック・スペースなどにおける旅行者向けガイドなどに使う「メガホン・タイプ」と、ホテルなどでフロントスタッフと旅行者の間のコミュニケーションをサポートする「ステーショナリー・タイプ(固定されたタイプ)」の2種類を紹介した。前者のメガホン・タイプは、既存のメガホンと似た形状をしており、使い方も同じだ。すなわち、例えばメガホンに向かって「バスに行きます」と日本語で話すと、メガホンからは、英語、中国語、韓国語で「バスに行きます」と出力される。

もっとも現状では、こうしたシステムは、エッジデバイスでは入力と出力だけを担当し、(a)音声認識エンジンや(b)機械翻訳エンジン、そして(c)音声合成エンジンはいずれもクラウド側に存在する。パナソニックのYukitake氏は、現状ではクラウド側で担わざるを得ない(a)~(c)のエンジンを、VLSI技術の進化によってエッジ側で実行する必要性を説いた。「スムーズでレスポンスが速いコミュニケーションをいつでもどこでも行えるようにするにはエッジ側で実行することが望ましい。そのためには、「VLSI技術には、現状よりパワフルなコンピューティングパワーをより低消費電力で実現してほしい」(同氏)と語った。