皆さんこんにちはPartner of Medical Translatorsの津村です。

今日は、AI(機械)翻訳についてお話ししたいと思います。

2020年の東京オリンピックを控えて、大勢の来日外国人をおもてなしするために、様々な翻訳マシーンや翻訳ソフトが発売されています。

最近の携帯アプリやGoogle翻訳などの性能は極めて良くなり、来日する外国人とのコミュニケーション程度であれば、ほぼ完璧に翻訳されるレベルまできています。

また、PC用の翻訳ソフトの実力はTOEIC800点~900点レベルとささやかれており、「もう、日本人に英語の勉強は必要ない!」とまで言われているとか・・・。

そんな中、我々メディカル翻訳者も近い将来AI翻訳にその座を奪われてしまうのではないかと、質問してくる翻訳を勉強中の受講生が増えています。

 

 

 AI(機械)翻訳技術の革命

現在、広く使われている翻訳エンジン(OS)は大きく、統計的機械翻訳(SMT:statistical machine translation)系列とニューラル機械翻訳(NMT:neural machine translation)系列の二種類に分かれています。

しかし、AI翻訳エンジンはどれでも、どれだけ多くの例文、例題をメモリーに蓄えているかが、基本的な性能の優劣に繋がっています。

 SMT(統計的機械翻訳)

この翻訳エンジンは第一世代のOSで、2000年ごろから普及し、機械翻訳を世界に広めた立役者です。

メカニズムとしては結構込み入っているのですが、非難を承知で大雑把に言いますと・・・

  • Word to wordを基本として、原文の一語ずつに対応する訳文の候補をメモリーから検索し、統計学的に計算した使用される確率の高いものを選択する手法。
  • ソフト内では確率計算がメインですから、ソフトが何をやっているかは人間にも解ります。
  • フレーズやセンテンス全体として訳している訳ではないので、かなり突飛もない訳文が出てくることがあります。
  • 英文和訳は比較的よくできますが、和文英訳はなかなか難しい様です。

訳文は一応、文法に従って並べられていますが、主文に複文や従属節がくっついてくると、いわゆる機械翻訳文となっていしまい、論理が崩壊している文になりがちです。

 NMT(ニューラル機械翻訳)

こちらは2014年ごろから使われ出した最新の翻訳エンジンです。その特徴は、名前の neural=神経 が示す様に、人間の神経細胞における情報伝達の仕組みを模した計算モデルであり、翻訳だけでなく、自動車の自動運転、音声会話、ロボティクス(ロボット工学)などにも使われています。

代表的なのが、将棋ソフトで、最近ではプロの一流棋士に連勝しています。このエンジンの特徴は、自分の経験から学習する能力があることで、将棋ソフトでは、人間との対局を重ねるごとにソフト自体が学習をしていて、現在の将棋ソフトでは開発者でさえも、今現在のソフト内の思考アルゴリズムはよく解らないのだそうです。

メカニズムとしてはSMTよりもさらに込み入っているのですが、こちらも非難を承知で大雑把に言いますと・・・

  • Phrase to phraseを基本にし、重要と思われる一語の前後の語、さらにその外側の前後の語と、複数語の関連性から訳語を選択し、フレーズとして仕上げていき、フレーズを適切に結合することで完成度の高い訳文に仕上げます。
  • 訳し抜けがSMTより多いのが欠点ですが、フレーズ間の論理性を保っているので出来上がった訳文のQualityが高く、訳文だけを見ても訳し抜けが解らない。
  • 翻訳をどこで終わらせるかはエンジンが判断しているので、人間が介入できない。(そのため、訳し抜けが生じやすい)

 SMTとNMTのどちらが優れているか?

どちらの翻訳エンジンも一長一短がありますが、NMTの方が人間の翻訳者と類似した間違いが多い様です。

以下の図↓は、ア ジ ア 翻 訳 ワ ー ク シ ョ ッ プ(Workshop on Asian Translation: WAT)において、科学技術論文を2015年版のSMTと2016年版のNMTで機械翻訳(日⇔英)した訳文の完成度を人間が評価したものです。

 

出典:機械翻訳の新しいパラダイム:ニューラル機械翻訳の原理(中澤敏明)詳しくはこちら

全体としては、NMTの方が評価が高いようで、NMTはSMTよりも評価の悪い方(レベル1、2)の訳文が減っています。しかし一方で、NMTでは最も評価の高いレベル5がSMTよりも減っています。

高い評価がNMTで減っていた原因は、現在のNMTの最大の欠点である「訳し抜け」の多さにあると中沢氏は指摘しています。

NMTにとって、訳し抜けを減らすことが今後の課題ですが、このためにはNMTのアルゴリズムの変更が必要です。しかし、これは生半可なことでは出来ませんので、今一度のブレークスルーが必要になりそうです。

 

 メディカル翻訳はAI翻訳に取って代わられるか?

SMTにしろNMTにしろ、英文和訳は比較的高品質で翻訳するのですが、和文英訳ではまだまだ改善が必要だと言うことです。

また、原文が1~2行程度の普通の文章であれば、比較的高品質で翻訳するのですが、これが3行を越える長文になると、まだ手に余るとのことです。

さらに、専門的な解釈が必要な法律関連とか医薬関連の文章の翻訳にはもっと時間が必要・・・とのことです。

以上を勘案しますと、少なくとも私がメディカル翻訳をやっている間は、まだAI翻訳に取って代わられることはない(といいなぁ)と思っています。

 TOEIC800点~900点レベルでも翻訳は無理か?

TOEIC800点から900点レベルと言いますと、自力で読める新聞や書物、聴いて理解できるTVなどが増えてきます。このレベルまでくると、海外での仕事などに殆ど支障が出ないレベルだと言われています。(TOEIC参考書より)

しかし、TOEICはあくまで日常会話と日常ビジネス関連で使用する英語の習熟度ですので、TOEIC800点から900点レベルの人が翻訳者に直ぐなれるかというと、それほど生やさしいものではありません。

私のメディカル翻訳講座の受講生も、大半はTOEIC800点から900点レベルの人ですが、毎回の課題添削は赤ペンの方が多いですし、翻訳エージェントのトライアルテストにもなかなか受からないのが実情です。

 AI翻訳の本質的欠点

次の英文をGoogle翻訳(NMT系)で訳してみました。

He saw a lady in the restaurant with binoculars.

普通の日本人であれば、「彼は双眼鏡で、レストランにいる女性を見た。」と訳し、双眼鏡を持っているのは彼で、レストランにいるのは女性だと解釈します。

Google翻訳文:彼はレストランで双眼鏡を持った女性を見た。

しかし、Google翻訳では、彼も女性もレストランの中にいて、手に双眼鏡を持っている女性を彼が目撃した・・・と言うことになります。

ちなみに、人間の訳した「彼は双眼鏡で、レストランにいる女性を見た。」をGoogleで英訳すると「He saw a lady in the restaurant with binoculars.(原文と同じ)」となりました。

一方、Google翻訳の和訳文「彼はレストランで双眼鏡を持った女性を見た。」をGoogleで英訳すると「He saw a woman with binoculars at the restaurant.」となりました。

Google翻訳では、文法に従って、in the restaurant とwith binocularsがladyに掛かっていると判断した様です。そのため、人間の和訳文の「彼は双眼鏡で、」の様に双眼鏡が彼に掛かっていることを文法的に明らかにすれば、元の英文に戻ることが出来るのです。

では、人間は何故、文法的に正しいGoogleの和訳文の様に解釈しないのでしょうか?

人間が翻訳を行う場合、意識するかしないかに係わらず、当該文章を越えた一般常識と共に文章を解釈しているのです。

どういうことかと言うと、人生経験上、双眼鏡を使ってまでのぞき見するのは通常「男性」で、そのお目当ては(美しい)女性をみつけること・・・と言うことを知っているからです。

つまり、人間が書いた文章は、もちろん文法に従って構築するのですが、それ以上に一般常識に従って表現し解釈しているのです。

さらに、その文章が法律関連であったり、医薬関連であれば、一般常識にプラスして法律常識や医薬常識を加味しないと人間らしい表現や解釈は出来ない・・・と言うことです。

TOEIC800点~900点レベルの人がメディカル翻訳者に直ぐなれない理由は、一般常識では相当のレベルに達していても、医薬常識のレベルがまだまだ足りないからです。

同様に、AI翻訳では、人間での一般常識も無ければ、ましてや、医薬常識もありませんので、それらの常識がある程度まで蓄積されないと、メディカル翻訳者に取って代わることは難しいと思われます。

それには結構時間を要すると思いませんか!

デハデハ