特集記事

- C.C., エディター

前号のニュースレターでは、迫り来るAIについての課題とAIが学術出版を一新させる可能性について取り上げました。今回は機械翻訳について見ていきます。Google翻訳をはじめとする機械翻訳ツールが登場してから何年も経ちましたが、今ではDeepLなどの新しいツールが参入しています。これらのツールを強化する技術は年月とともに洗練され、今ではそのほとんどに様々な機械学習やニューラルネットワークが使用されています。研究出版物の主たる言語が英語である一方、多くの研究が非英語圏の国で行われていることを考えると、これは特に興味深いことです。また、こうした実情から生じている不公平は、将来的に機械翻訳によって改善できると考える研究者もいます

しかし、機械翻訳の最大の懸念事項は正確さです。たとえば、言語情報の多くは文脈に依存しており、読者が正しく推測できると著者が見なした場合には、多くの情報が省略されることもよくあります。これは、他の問題の中でも特に、歴史的に機械翻訳ツールにおける問題とされており、広く議論されてきました

しかし、機械学習技術の向上により、この状況はまもなく変わるかもしれません。事例を言えば、DeepLなどは、長年かけて大きく進歩してきたGoogle翻訳のような古参と比べて目を見張るような精度を示し、英語と日本語のような難しい言語ペア間でも驚くほど自然な翻訳を生成します。まだデータは少ないものの、日本の研究チームによる分析を含め、こうした噂や体験談がある程度信頼できることを示す予備分析もあります。

このような期待高まる進歩にもかかわらず、上記の予備分析の著者も示唆しているように、機械翻訳には依然として多くの制限があり、特に専門性の高い情報や非常に複雑な文構造に留意しなければなりません。機械翻訳ソリューションは非常に興味深いものですが、当面は、分野の専門家である人間が翻訳をレビューする必要があります。

英語版はこちら