« ロシア語に翻訳する - vene keelde tõlkima | トップページ | エストニア語と自動翻訳 - eestikeelne masintõlge »

話し言葉の音声認識 - kõnesüntees ja kõnetuvastus

 新聞のニュースで読んだだけだが,Apple から出たばかりの iPhone4s は,英語で話しかけると「2001年宇宙の旅」に登場する大型コンピュータ HAL のような単調な声で答えるらしい。日本語やエストニア語でもできるのだろうか,興味があるが,その話は聞こえてこない。

 記事: Telefon paneb eestikeelse jutu üle ootuste hästi kirja (Postimees 2011/10/22)
 記事: Rakendused masinatega eesti keeles suhtlemiseks ei jõua kasutajateni (Postimees 2011/10/22)

 機械と人間話できるためには,人間の声と同じように聞こえる音声合成 kõnesüntees の技術だけでなく,人間がふつうに話すときの声を音声言語として解析する音声認識 kõnetuvastus の技術が必要になる。

 音声合成の方は,たとえば Google 翻訳のサイトのテクスト読み上げサービスを利用してみればわかるように,かなりのレベルに達している。もちろん HAL には遠く及ばないのはしかたがない。HAL は所詮声優の声である。

 音声合成の場合は,文法や綴りの間違いのない文を1つの声で読み上げるだけだから,比較的容易に実現できると,推測される。また,人間の耳は融通が利くから,多少不自然であっても言いたいことがわかってしまうことが多い。これに対して,音声認識はやっかいである。まず,ひとりひとり違った話し方をする大勢の人間の声を母音と子音の連続として聞き取れるだけでなく,それを単語に分割し,かつ文の構造を文法的に解析できる段階までもっていかないと,およそ実用にはならない。さらには,騒音のある場所で,人間の声とそうでない雑音を区別して,人間の声だけ聞きとることができなければならないという要請もある。

 キーワードを組み合わせて,ウェブ上の文字情報を検索するサーチエンジンのようなシステムも含め,人間が日常的な場面で使っている文字言語や音声言語の処理を行うコンピュータ科学の分野をLT (language technology),すなわち言語工学と呼ぶらしい。LTは,今流行りのIT (情報工学) の一分野である。このLTに相当するエストニア語は keeletehnoloogia である。

 音声認識の技術は,エストニアでもそれなりに研究・開発が進んでいるらしい。アンドロイド携帯端末に話しかけた声が録音され,音声ファイルとして,携帯電話会社のサーバーにアップロードされる。そのあと,音声認識と解析が行なわれ,文として認識され,通常の綴りで出力されたものが,ユーザーの端末に送信され,文字で標示されるという仕組みが実験段階にあるらしい。

 実際にこの音声認識+書き取りシステムがどの程度の信頼性をもつものかを試したい人は,音声ファイルを送信すれば,メールで答えを送り返してくれるこのサイトにアクセスしてはいかが。私は音声ファイルが苦手なので試していないが,スカイプしているパソコンなら,簡単に録音ができるはずだし,ICレコーダのファイルを使うこともできるはずである。お試しになった方はぜひお話をお聞かせください。

電話          telefon
期待以上に      üle ootuste
メモする        kirja panema
言語工学       keeletehnoloogia
応用          rakendus
携帯電話       mobiiltelefon
ダウンロードする   alla laadima
アップロードする   üles laadima
実験する        katsetama
ユーザ         kasutaja
エストニア語の    eestikeelne jutt
保存する        salvestama
音声ファイル      helifail
データ通信網     andmesidevõrk
ことば,話       kõne
解析する,認識する tuvastama
音声認識       kõnetuvastus
理解する        aru saama
間違いを        vigu tegema
音声          hääl
元テクスト       algtekst
試す          proovima
デスクトップ      lauaarvuti
入手可能な      kättesaadav

Tanel Alumäe TTÜ Küberneetika Instituudist näitab eestikeelse kõnetuvastuse rakendust nutitelefonis.

|

« ロシア語に翻訳する - vene keelde tõlkima | トップページ | エストニア語と自動翻訳 - eestikeelne masintõlge »

パソコン・インターネット」カテゴリの記事

携帯・デジカメ」カテゴリの記事

言語」カテゴリの記事

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: 話し言葉の音声認識 - kõnesüntees ja kõnetuvastus:

« ロシア語に翻訳する - vene keelde tõlkima | トップページ | エストニア語と自動翻訳 - eestikeelne masintõlge »