音声認識の運命(続き)

2014-04-04 07:05

私は音声認識に代表されるNatural User Interfaceにはつねに懐疑的な態度をとっている。もっと正確に言えば、「それらに対する過剰な期待」に懐疑的な態度をとっている。こうして文字にすると当たり前のことだな。

昨日のエントリーを書いてから、面白いことに音声認識関連のニュースがいくつか続いた。

まず親愛なるMicrosoftだ。

米Microsoftは4月2日(現地時間)、「Build 2014」の基調講演で、モバイルOSのアップデート「Windows Phone 8.1」の新機能「Cortana」(コルタナ)を発表した。米Appleの「Siri」や米Googleの「Google Now」と競合する音声によるパーソナルアシスタントだ。

via: Microsoft、「Cortana」発表──Siri対抗のパーソナルアシスタント - ITmedia ニュース


昨日この基調講演を見ていた。まずコルタナを紹介したところで「わざとらしい歓声」があがったのに笑った。この「わざとらしい歓声」はMicrosoftの伝統芸なのだろうか。しかし今頃Siriもどきをだされてもねえ、と誰もが思ったのだろう。

もう一つ面白かったのが、デモがなかなかうまくいかなかったことだ。今日の気温は?(Fで返答が変える)「気温を摂氏で」というとちゃんと返答が返る(カナダでは摂氏が使われているのか?)しかしデモはそこで止まらず

「ケルビンで(絶対温度)」

という。Geek相手のプレゼントしてはなかなかいいネタだ。しかしコルタナちゃんはなかなか理解してくれない。最後には諦めた。デモをしていた人が言うとおり「5000人を前に音声認識のデモをするのは難しい」のは本当だろう。しかしこのデモは音声認識技術は21世紀になって10年以上もたつのに未だに

"Speak and Pray"

という状態にあることを示している。(以下のビデオの28分ほどから)


このような状態ではあるが、ソフトウェアの巨人たちは依然として音声認識技術に対する掛け金を釣り上げている状況のようだ。

Apple has acquired Novauris Technologies, a company with a lot of talent in the automatic speech recognition field, according to a report from TechCrunch.

via: Apple acquired speech recognition company Novauris last year to improve Siri | 9to5Mac


このニュースを見て「?」と思った。調べてみて驚いた。この会社-NovaurisのCEOは前職の時に何度訪問してきてくれたことがある。とても感じのよい「真面目なエンジニア」という感じの人だった。スマホ上で日本の駅名を認識するデモをしてくれた。Linked in で調べてみれば確かにManager Siri at Appleになっている。

私は今のような方向から攻めていってはたして音声認識が使える技術になるのかどうか非常に疑問に思っている。問題が存在していることは確かだし、誰もそれに対する「鍵」を見つけていないから攻撃するのは正しい。しかしもっと創造的な攻撃方法がないかと思うのだ。機械と人間の間には越えがたい壁が存在しており、音声認識がこれだけの努力にもかかわらず使い物にならないのはその壁にぶつかっているからだ。壁をくぐるか、避けるか全く別の方からの攻撃が必要だ...というだけなら簡単だが。