多くの研究者は,類語集や文法規則に従って言語を分析しようとしても,翻訳の問題は解決できないと考えている。そこで,こうした従来の作戦をほとんど放棄した新しい手法が生まれた。たとえば2006年の米国標準技術局の機械翻訳コンテストでは,グーグルのチームが圧倒的な差で優勝し,多くの機械翻訳の専門家を驚かせた。グーグルのチームでは,コンテストで使用された言語(アラビア語と中国語)をだれも理解していなかった。そして,ソフト自体も同じように理解していなかったかと言えるかもしれない。このソフトは,意味や文法規則をなに1つ知らなかったのだ。ただ人間による質の高い翻訳(ほとんどは国連の議事録からのもので,この議事録はおかげで21世紀のデジタルのロゼッタ石になりつつある)の膨大なデータベースを利用して,過去の訳文に従って語句をつなぎ合わせたのである。それから5年後のいま,こうした「統計的」な技法はまだ完全ではないものの,ルールベースのシステムを完全に圧倒している。
ブライアン・クリスチャン 吉田晋治(訳) (2012). 機械より人間らしくなれるか:AIとの対話が,人間でいることの意味を教えてくれる 草思社 pp.96
PR