特集記事


- K.N., シニアトランスレーター

機械翻訳は大意をとらえることができる場合があるものの、正確さと読みやすさの点で人間の翻訳に劣り、必ずと言っていいほど誤訳をします。自動運転車が公道を走り、手術支援ロボットによる脳神経外科手術が行われ、ソフトウェアがトップ棋士を負かす時代になっても、また数十年も前から研究開発が進められているにもかかわらず、コンピューターが依然としてうまく翻訳できないのはなぜでしょうか。

その理由としてよく引き合いに出されるのは、言葉には複数の意味があり、コンピューターは文脈に基づいて適切な意味を選択することができないという点です。複数の意味や用法を持つ単語はたくさんあり (中には179もの意味や用法を持つ単語もあります)、単語の意味は文脈に依存します。例えば「pitch」という単語は、音楽、野球、登山、ビジネスのどの分野で使われるかによって意味が異なり、イギリス英語ではそれ以外の意味も持ちます。たとえコンピューターが分野を特定できたとしても、同じ分野で用いられる同綴異義語 (例:「いきもの」とも「なまもの」とも「せいぶつ」とも読める「生物」;レントゲン検査に使われる「バリウム」と抗不安薬の「バリウム」) を区別することはできません。このことは単語だけでなくフレーズや文にもあてはまります。例えば「chemistry test」は学校の現場で使うのか (「化学の試験」)、映画産業で使うのか (「相性テスト」) によって意味が異なり、「He turned two.」は幼児について言うのか (「2歳になった」)、内野手について言うのか (「ダブルプレーを取った」) によって意味が違います。つまり翻訳では、単語や文単位の情報だけでなく、機械翻訳では力の及ばない、より広い範囲の文脈情報を用いることが必要なのです。その上、他の言語では同じ言葉が複数の概念に分かれるケースもたくさんあります。例えばスペイン語では、「魚」はその状態に応じて「pez」と「pescado」を使い分け、「理解する」と言う場合も状況によって「entender」または「comprender」を用います。また、「やるせない」や「~してしまった」のような対訳のない日本語独特の言葉を翻訳するときは、翻訳者の創意工夫が必要です。上記の例はほんの一部で、異なる言語の間に一対一で対応する言葉がないケースは数えきれないほどあります。単語やフレーズの意味は常に文脈に依存しますが、機械翻訳は文脈を正確に理解することができないため、どうしても間違った翻訳文を生成してしまうのです。

第二の理由として、翻訳では、原文に書いてある言葉だけでなく、明示されていない情報を読み取って訳文に反映させる必要があることが挙げられます。例えば、日本語では主語が頻繁に省略されますが、英語には主語が必要なので、翻訳者が英語に訳すときに日本語の文脈から主語を推測して補っています。また、日本語には冠詞がなく、基本的に単数形と複数形の区別がないので、英語に訳すときには文脈から判断してそれらも追加しています。更に、訳語の選択は、文章の流れ、トーン、強調点、微妙なニュアンス、構成語間の相互作用などの推論的要素や、スタイル上の適切性、使用目的、対象読者などの背景情報にも左右されます。テキストを正確に解釈し訳出するには、これらの要素も考慮する必要があり、そのためには行間を読み取る能力が不可欠となります。さらには、リサーチスキルや専門知識、および異文化理解力も求められることがあります。このような能力は人間固有のものであり、コンピューターには真似のできないことです。個々の単語は表層的な情報を伝えているだけであり、書き手の意図した全体の意味を氷山に例えれば、単語はその一角にすぎません。テキストの意味のほとんどはもっと深いところにあり、意味を完全に理解して、別の言語で表現するには、人間の知力が必要なのです。

第三に、機械翻訳は辞書的定義に頼り過ぎる特徴があり、逐語訳を生成しがちです。そのため、比喩的表現、婉曲表現、空似言葉、業界用語、口語表現、新造語などの言語の多様な側面に対応することが難しいのです。

第四に、機械翻訳は文法理解力に欠けていて、単語を適切に並べ替えることができません。このため、文法的に間違った不自然な文を合成し、意味の通らない翻訳になりがちです。日本語と英語のように文法が大きく異なる言語間では、こうした欠点は増幅されてしまいます。

最後に、原文に「書いてある」ことが書き手の「言わんとしている」ことだとは限りません。テキストには表記や句読点、文法上の誤り、論理の飛躍や破綻があるかもしれません。熟練した翻訳者であればこのようなミスに気づき、訂正することができますが、コンピューターは訂正どころかミスに気づくことさえできません。そのため、間違いがそのまま翻訳文に反映されてしまいます。また、原文に曖昧さが存在する場合、特に (日本語にありがちな) 分解するのが難しい長く複雑な文章は、解釈し辛いです。そのような文章を適切に分解し、正確に解釈するには、ソース言語と原文の内容に精通していなければなりません。

つまり翻訳は、個々の単語やフレーズを別の言語の等価表現に置き換えるだけで完成するものではないのです。翻訳とは原文の「単語」にひとつずつ訳語をあてる作業ではなく、文脈に基づいて (明示的・暗示的な)「意味」を訳出する複雑な作業であり、人間の深い洞察力、優れた言語感覚、柔軟な思考能力が必要とされるのです。このプロセスはあまりにも複雑なため、機械翻訳の確率モデルや予測モデルに基づいた単純で杓子定規なアプローチではうまくいかないのです。どんなに技術が進歩し、人工知能が発達しても、あるいはシンギュラリティが到来しても、この事実は変わらないでしょう。自動車、外科手術、将棋と異なり、翻訳はテクノロジーや科学、ゲームではありません。翻訳はアートであり、人の感性や人間味が求められるのです。そのため、機械翻訳は依然として低品質で信頼できないレベルであり、今後も人間の翻訳者に追いつくことはないでしょう。

英語版はこちら