« 話し言葉の音声認識 - kõnesüntees ja kõnetuvastus | トップページ | 秋のタルトの街 - sügisene Tartu »

エストニア語と自動翻訳 - eestikeelne masintõlge

 音声認識につづいて,今度はグーグル翻訳に代表される自動翻訳の話題である。エストニア語と日本語の間のグーグル翻訳は当面は使い物にならないが,英語との間だと少しは様になってきている。

記事: Masin tõlgib üha paremini (Postimees 2011/10/22)

 ある時期までの機械翻訳研究の主流は,元の言語の文の構造を文法的に解析し,それに基づいて意味を解釈していく方法だった。大雑把な言い方をすれば,日本の高校生が,文法書と辞書を頼りに悪銭苦闘する英文解釈の手法と似たようなものだ。一見合理的なのだが,この方法では翻訳の精度が頭打ちになることがわかってきた。

 そこで,そのような文法規則を使う方法と合わせて,あるいは単独で使われるようになったのが,確率的な方法である。詳しいことは知らないが,簡単に言うと,大量の対訳のテクストをコンピュータに解析させ,どの単語がどの単語と対応する頻度が高いかを明らかにし,その情報に基づいて訳語を決める方法らしい。この方法は,対訳テクストがどのくらいたくさん利用できるかに鍵があるために,データの少ないエストニア語と日本語の間でグーグル翻訳すると,悲惨かつ滑稽なことになるわけだ。

 ロシア語や英語との間だと,かなりいい成果が得られる。ただ,機械翻訳の出力は,当面は人間が読んだ時に意味がどのくらい正確に読み取れるかを基準に評価されるべきもので,最終的には人間が推敲しないと,そのままでは使えないものが多い。

 タリン工科大学の言語工学の専門家によると,音声認識と機械翻訳の現状では,話しことばを自由自在に通訳してくれるようなシステムは夢のまた夢だが,YouTube にアップロードされて公開されている動画の英語のサブタイトルをエストニア語に訳すことのできるくらいのシステムなら,近いうちに実用化される可能性が高いそうである。

 関連ページ: グーグル翻訳 - tõlkima (2010/06/18)
 関連ページ: エストニア語の翻訳サイトを試す - tõlkima (2011/02/12)

 比較のために,この記事の冒頭の文を,英語,ロシア語,日本語にグーグル翻訳してみたところ,こうなった。日本語は何のことだかわからないが,英語とロシア語はほぼ意味がわかる。ただし,後半は「言語障壁を取り除きつつある」なのに「言語障壁を拡げつつある」という反対の意味になってしまっているので,総合点はあまり高くできそうにない。

Kõige tuntum eestikeelse masintõlke rakendus on seni Google Translate, mille tõlgete üle saab aeg-ajalt naerda, ometigi on selle levik juba hakanud keeleruumide vahelisi barjääre maha võtma.

The most famous Estonian machine translation by Google Translate is still operational, the translations can be transferred from time to time to laugh, yet it has already begun to spread the language barriers between spaces down.

Самый известный эстонский машинного перевода Google Translate по-прежнему функционировать, переводы могут быть переданы от времени смеяться, но он уже начал распространять языковые барьеры между пространствами вниз.

Google翻訳で最も有名なエストニア語の機械翻訳はまだ動作している、翻訳が笑って随時転送することができます、まだそれは既にダウンスペース間の言語障壁を広めるために始めている。

 もう少し原文に忠実でわかりやすい翻訳にするとこうなるだろう。

最も有名なエストニア語機械翻訳の応用は,目下のところグーグル翻訳で,その翻訳は時に笑わせてくれるが,その普及のおかげて,異なった言語空間の間の障壁が取り除かれ始めている。

機械,コンピュータ  masin
翻訳する        tõlkima
最も有名な       kõige tuntum
エストニア語機械翻訳 eestikeelne masintõlge
翻訳          tõlge
時々          aeg-ajalt
笑う           naerma
拡散          levik
取り除く        maha võtma
コンピュータ      arvuti
実験,試験       katsetus
不器用な        kohmakas
大型計算機      suurarvuti
能力           jõudlus
ラップトップ       sülearvuti
記述する        kirjeldama
入力する        söötma
比較する        võrreldama
速度          kiirus
完璧な         täiuslik
言語工学       keeletehnoloogia
理解可能な      arusaadav
話しことば       suuline kõne
奇跡          ime
生きているうちに   oma eluajal
課題          ülesanne
領域          valdkond
ありそうな       tõenäoline
字幕          subtiiter

Google Translate

|

« 話し言葉の音声認識 - kõnesüntees ja kõnetuvastus | トップページ | 秋のタルトの街 - sügisene Tartu »

パソコン・インターネット」カテゴリの記事

言語」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/543873/53063488

この記事へのトラックバック一覧です: エストニア語と自動翻訳 - eestikeelne masintõlge:

« 話し言葉の音声認識 - kõnesüntees ja kõnetuvastus | トップページ | 秋のタルトの街 - sügisene Tartu »