記事の更新は少ないです…が時々コメント欄で話題を広げていたりします。楽しいコメントをいただければ嬉しいです。
(返信できないかもしれません。ご了承ください)

2011年6月28日

音声認識とノイズキャンセルヘッドホンとHFP

文字おこしをしないといけないんですが、それはもう重労働なんです。
というわけで少しでも負荷を減らしたく、音声認識を試してみています。

きっかけは、iPhoneやAndroidのGoogle音声認識、AmiVoice、DragonSpeechの音声認識精度がめざましく向上していること。docomoのAndroid端末のCMで演出されていますが、単語レベル、文章レベルでの認識精度は、往年の音声認識システムからすると、めざましく進化していると感じるものがあります。

これを見て、PCの音声認識も気がつかないうちに性能が高くなってるんじゃないか?という淡い期待を抱いた訳でございます。ただ、もちろん、無料のWindows7に標準搭載の音声認識。(コントロールパネルに「音声認識」という項目があります)

PCでの音声認識でまず必要なのは音声認識に適したマイクの入手、そして音声認識トレーニングに時間をかけるということになります。ノートPCだと本体に内蔵していたりしますが、キーの打鍵音とか、クーリングファンの音とか、声とノイズの分離が難しいので、口元に近いクリップマイクや、コールセンターの人がしているようなヘッドセットが一番適しているといわれています。

というわけで、Skype用のものをいろいろ試してみたんですが、

HFP+ノイズキャンセルはだめです

HFP+ノイズキャンセルはだめです

デジタルノイズキャンセルの影響か、HFPの低ビットレートの影響か、うまく認識してくれなかったり、話し始めにタ行の音が入ってしまったりします。結局ふつうの有線マイクが一番という結果でした。

音声認識トレーニングは何度も何度もしたほうが認識精度があがるようです。最初はタイミングが合わず、間違いなくイライラしたり失笑したりすると思いますが、馴れてくると「まあ仕方ないかな」と思えるようになるので、そのときに何度も何度も何度もトレーニングしたほうが圧倒的に認識精度はよくなります。「音声認識はキーボードで入力するよりも効率的に文字を入力することができます」とか「音声で文字を入力することは楽しいです」みたいなことを延々朗読させられるので、若干洗脳されますが。


さて、ただ、Windows7の標準添付の音声認識はクラウドでもなければ、認識精度がとりわけ高いわけでもありません。というわけで、他社製音声認識のPC版を探してみました。

AdvancedMedia社のAmiVoiceのPC版はAmiVoice SPという名前です。こちらのパッケージ、64bit対応となります。これが今時の一番の注目株になります。

DragonSpeechはバージョンが2005で止まっていて、Win7対応も不明。64ビット対応も不明。長く使うには少し不安の残るパッケージなので、ぜひDragonSpeech2011を開発していただきたいと願う次第です。
同社にはもう一つ、文字おこしに特化したVoiceWritingというソフトがあるようですが、こちらはwindows7非対応でした。(インストール、実行できないのを確認済み。)

個人的には3番目に一番期待していたぶん、落胆もひどいのですが、素直にAmiVoiceSPをトライしてみようと思います。ちなみに音声認識ソフトの価格は最低でも1万円~3万円程度はかかります。上質なキーボードを買うとだいたい2~3万円。きちんと使えるソフトでないと、結局HappyHackingKeyboardの最上位機種を買った方がいいという結果になってしまうのですが、AmiVoiceSPさんには、体験版がありません。体験版がありません!体験させてくれないと、ちょっと怖くて買えません…。

というわけで、AdvancedMedia様、AmiVoiceSP体験版、よろしくお願い申し上げます

0 件のコメント: