↑ トップ頁へ

2006.11.6
 
 


音声認識ソフト普及の鍵…

 新OS、Windows Vistaは音声認識のデモでは大失敗(1)した。とは言え、Windows XP(Microsoft Speech API)に比べて、音声認識精度はかなり上がって、使い易くなっているようだ。(2)

 パソコンの処理能力が格段に向上しているから、積極的に利用する動きが始まってもよさそうに思うのだが、そんな話は余り聞こえてこない。

 そもそも、音声認識が騒がれたのは、1990年頃だったと思う。米DARPAによる新聞ディクテーションプロジェクトが立ち上がったからだ。まあまあの成果が得られ期待は高まった。
 そして、Windows95/98の登場に合わせ、PC用ソフトが普及した。

 しかし、残念ながら、期待のほどではなかった。
 利用する前に長時間、決められた文章をコンピュータに向かって話すという面倒な準備作業が必要な上に、いい加減な文章で話したのでは、さっぱり認識してくれないからだ。
 要するに、文語体で正確に読み上げた時しか、高い認識精度は実現できないということ。機械の能力に合うように、人間の方がロボットになったつもで話さないと機能しないのである。

 小生も、パソコンのオマケについてきたソフトを使おうとはしたが、結局のところ断念した。タイピングの方が圧倒的に早いからである。

 その後の進歩も著しいらしいが、言語モデルでの解析が優れているだけで、音響分析の方は今一歩のようだ。
 日本語は、単純な音が多いし、音が繋がることも少ないから、音声認識は一番簡単ではないかと思うが、それでも、なかなか実用レベルに到達しないようで、まことに残念至極。
 と言っても、 日本IBM、NEC、東芝ソリューションズ、アドバンスト・メディア、 アスキーソリューション(Nuance)(3)[Philips音声処理事業, ScanSoft/Dragon/Speech Works/ HRT, を含む]、等のソフトを駆使している人は結構いる筈である。
 おそらく、こうしたソフトを利用している場面が目立たないのだと思われる。

 つまり、音声認識ソフトは、「使えない」のではないということ。小生も含めて、未だに「使おうとはしない」人が多いのだ。

 実際、その気になって使えば、かなり役に立つらしい。タッチタイピングができないため、修士論文執筆を音声入力で行っている学生さんもいる。(4)自分の声の特徴を覚えさせる準備作業も10分程度で済むそうだし、マイクの仕様や位置を注意さえすれば、十分機能するから、便利なものだという。但し、話す場合、認識できる単語を使う、という条件が曲者のような気もするが。

 ともあれ、使う場面によっては、結構、重宝するのである。

 こんな話をしたくなったのは、2006年10月26日、IBMインド研究所が英会話上達技術を開発したと発表したからである。(5)
 専用の音声認識ソフトで、文法、発音、理解力を評価するという。音の強弱や、フレーズでの発音を点数評価し、訓練が必要な部分を指摘する仕組みのようだ。
 考えてみれば、コールセンターの従業員のように、型にはまった受付をする職業は少なくない。その教育をコンピュータで行なうやり方には利点が多い。コンピュータが理解できない話し方は失格とすれば、訓練生は認識率を上げるように頑張ることになる。合格すれば、誰でもがわかるしゃべり方になっている筈。
 コンピュータに人が使われる状態だから、嫌がる人もでるかもしれぬが、なかなか優れたコンセプトだと思う。

 音声の癖を判別する生体認証や、音声を加工するコミュニケーション支援も、これと同類の考え方であり、音声認識技術の利用シーンは色々とありそうだ。
 音声認識ソフトの普及は、細かな技術進歩より、技術をどう生かすかにかかっていると思う。

 --- 参照 ---
(1) “Windows Vista は見切り発車か” [2006.8.3]
(2) http://www.microsoft.com/japan/technet/WindowsVista/library/c208e792-e591-455a-82d9-a98264324e0d.mspx
(3) http://www.nuance.com/company/
(4) http://mikan-neko.air-nifty.com/blog/2006/10/post_bdfa.html
(5) http://www-03.ibm.com/press/us/en/pressrelease/20510.wss
(参考)
  特許流通支援チャート「音声認識技術」工業所有権情報・研修館[2006年3月]
  http://www.ryutu.ncipi.go.jp/chart/H17/denki34/fdenki34.pdf


 インターネットのインパクト の目次へ>>>     トップ頁へ>>>
 
    (C) 1999-2006 RandDManagement.com