機械翻訳

機械翻訳とは? 自動翻訳との違い、人手翻訳との使い分けやメリット・デメリット

機械翻訳とは? 自動翻訳との違いは? 本記事では機械翻訳のメリットやデメリット、人手翻訳との使い分けなどを解説します。
machine-translation-blog-post-featured-image

「最近の翻訳は機械がやってくれるんでしょう?」「AIによって翻訳者の仕事がなくなる」……そんな声を耳にしたことのある人も多いのではないでしょうか。そこにはややイメージが先行している面があるかもしれません。

業務に機械翻訳の導入を検討しようとしている方、今後のビジネスの海外展開に向けて基本的なことを押さえておきたい方、そんな方々に役立つ内容になれば幸いです。

機械翻訳とは?

「機械翻訳」とは文字通り、人手を介さず機械が行う翻訳のことです。英語でも同様にmachine translationと呼ばれ、翻訳業界では「MT」という略称がしばしば使われます。これに対して、従来の人間が行う翻訳のことを「人手翻訳」「人力翻訳」と呼ぶことも増えてきました。携帯電話の登場により、それまでの電話が「固定電話」と呼ばれるようになったのと同じ現象ですね。そこまで機械翻訳が浸透してきたことの証だとも言えそうです。

機械翻訳と自動翻訳の違いとは?

機械翻訳と似た文脈で使われる用語に「自動翻訳」があります。これらはどう違うのでしょうか?

自動翻訳(automated/automatic translation)とは、一般に、翻訳業務における反復作業を自動化するプロセスを指して使われる用語です。翻訳自体はもちろん、ファイルの前後処理や他のシステムとの連携などを含めた、ワークフロー全体を自動化するイメージです。つまり、自動翻訳を実現する要素のひとつとして「機械翻訳」があるという位置づけになります。実際の業務では、翻訳支援ツールや翻訳管理システムを使って、ワークフローの自動化が行われています。

なお、とくに日本では、主に音声を使ったリアルタイム翻訳を指して自動翻訳と呼ぶこともあるようです。音声翻訳の場合でも、まず音声認識により文字化して、それを翻訳し、再び音声に戻して出力するという処理がなされることが一般的ですので、この場合もやはり、自動翻訳プロセスの中で機械翻訳が行われていると言えます。

まとめると、機械翻訳は自動翻訳を実現するために欠かせない要素のひとつ、ということです。

機械翻訳の歴史

機械翻訳はどのような変遷をたどってきたのでしょうか?

機械翻訳の開発は、1950年代初頭に始まったと言われています。背景にあったのは、コンピューターの発達です。開発者はその計算能力を翻訳に活かそうと考えました。

最初にとられたアプローチは、ルールベース機械翻訳です。これはその名が示すように、人間が定義したルールと辞書に基づいてコンピューターが計算処理をし、翻訳文を出力するもので、いわば人間がコンピューターに文法を教えるような方法です。ただ、すべてを簡単に定式化できるほど翻訳は単純ではなく、複雑な計算を行うには、当時は機械の処理能力やデータの保存容量も十分ではありませんでした。

その後、さらなるコンピューターの発展と扱えるデータ容量の増加を受け、いわゆるビッグデータを活用しようという発想から生まれたのが統計的機械翻訳です。これは大量の対訳(原文と訳文のペア)データを統計的に解析し、最も頻度の高い訳語を採用しようというアプローチです。

やがて2000年代に入り、インターネット時代を迎えます。ネットワーク化された仮想空間には各国言語による大量の文章データが保存され、コンピューターの処理能力やストレージ容量も指数関数的に増大していきました。インターネット上には人間の読書量を遥かに凌ぐ量のテキストデータがあります。そのデータの力を活用することで、機械翻訳の質が向上していきます。

そして2016年、ニューラル機械翻訳が登場。新たなブレイクスルーが起こります。人間の脳内で神経細胞が行っている情報処理を模したこの手法により、極めて自然な翻訳文が出力されるようになり、人々を驚かせました。入力した文章に対してどのような訳文が出てくるかは開発者でもわからないといい、より「AI」のイメージに近づいたとも言えます。現在は、このニューラル機械翻訳が業界での主流となっています。

このように機械翻訳は、当初の人間が機械に法則を「教える」方法から、機械が自律的に「学習する」段階へと変遷を遂げてきたのです。

機械翻訳の代表的な3つの種類

改めて、先ほどの機械翻訳の3つのアプローチを整理しておきましょう。

ルールベース機械翻訳(RBMT)

人間があらかじめ定義した文法や構文の規則に基づいて、コンピューターが翻訳を行う方法。機械翻訳の元祖とも言える存在ですが、そのまま使えるレベルの訳文を出力することは難しく、今では過去の手法とみなされることが多くなっています。

統計的機械翻訳(SMT)

大量の対訳データ(コーパス)をもとに、コンピューターで単語やフレーズの関係を統計的にモデル化し、出現頻度の高いパターンを採用するアプローチ。技術、医療、金融など、分野固有のデータを用意できれば、現在でも質の高い翻訳を生成できるとされています。

ニューラル機械翻訳(NMT)

人間の脳の神経細胞で行われている処理を模倣した仕組みで翻訳を行う方法。一単語ずつ翻訳するのではなく、文章をいったん数値化してシステムに取り込み、ニューラルネットワークで処理を行なった後、新たに文章を書き出します。そのため、他の方法に比べて、極めて流暢な出力が得られることが特徴です。現在、業界で主流となっている方法で、AI翻訳などと呼ばれるものも、多くはこの手法を指します。

機械翻訳のメリットとは?

機械翻訳には以下のようなメリットがあります。**

  • 処理スピード:機械翻訳のメリットは、まず、なんといってもその処理スピード。短い文章なら瞬時に結果が返ってくるため、人手翻訳の比ではありません。ざっと内容を確認したいといった場合にはスピードは大きなメリットになります。
  • 低コスト:短時間で処理できるため、機械翻訳だけでタスクを完結させるなら、コストも必然的に人手翻訳より安価になります。
  • 効率アップ:とくに大量の文書を翻訳する必要がある場合は、高速で低コストの機械翻訳が威力を発揮します。翻訳プロセスの自動化により、連携するワークフロー全体の自動化・効率化も図れます。
  • 単純作業からの解放:翻訳者の側も単純作業は機械に任せて、より人間の翻訳者としての能力を活かせる作業に集中できます。

機械翻訳は完璧?課題とデメリット

では、機械翻訳は完璧なのでしょうか? いえ、何事にも良い面があればデメリットもあるのが世の常です。機械翻訳には以下のような課題があります。

  • 訳文の品質:一般的には、人間の翻訳者が時間をかけて行う方が、機械翻訳より高品質の翻訳が得られます。正確性も保証できないため、機械翻訳のみで完結させるなら、参考用の資料や社内コミュニケーションなどに用途を限り、機械翻訳であると断った上で提供するのが安全でしょう。ニューラル機械翻訳では、常にとは言えませんが、人間の翻訳者をうならせるようなレベルの翻訳が出力されるケースもあります。ただ、やはり細かいニュアンスや文化、歴史といった背景を把握した翻訳は機械には難しく、一般公開する文章では、翻訳の正確さを担保するためにも人の目によるチェックが必要でしょう。
  • 内部のブラックボックス化:とくにニューラル機械翻訳の場合、どんな出力が出てくるかは、文章を入力してみないとわかりません。そのため、結果を保証しづらい面があります。簡単な文章だから間違えない、とは言えないようです。 また、一見自然な文章に見えても、意味を完全に取り違えていたり、一部がごっそり抜けていたり、固有名詞が別のものと入れ替わっていたりといった、人間では考えにくい間違いが起こることがあります。つまり、ミスも予測がつきません。
  • 責任の所在:訳文の正確性や品質について、誰が責任を持つのかという課題もあります。車の自動運転等でも議論になっているテーマですが、機械翻訳のみに頼る場合は、思わぬミスがあって問題を引き起こした時に、どう対応するかも考えておく必要があるでしょう。

機械翻訳と人手翻訳、どちらを採用すべき?

このようなメリット、デメリットを考えた上で、機械翻訳と人手翻訳をどのように選択していけばよいでしょうか? まず、機械翻訳の品質は、次のような要因によって差が出てきます。

  • 言語ペア:スペイン語とフランス語など文法が類似している言語に比べて、英語と日本語など構文が異なる言語は、正確な翻訳が難しいケースがあります。
  • 対象分野:技術、法律などの文書は構造が比較的定まっているため、機械翻訳でも良好な出力が得られる傾向があります。一方、背景情報を含んだメッセージの伝達を目的とするマーケティング文書などは、機械翻訳を一部用いるにしても、人間主導で翻訳を行なったほうが良い結果になるでしょう。
    また、信頼関係の構築を目的とする顧客とのコミュニケーションなどは、人間らしさが重要な要素となるため、人手翻訳が適しているといえます。また、機械翻訳では表現や語彙が限られてしまう面があるため、文芸やエンターテインメントも人間による翻訳が向いている分野でしょう。
  • 事前編集の有無:あらかじめ原文を整理・調整して、機械翻訳エンジンが苦手とする要素を排除しているかどうかによって、出力品質に違いが出てきます。
  • エンジンの特徴:各社が開発しているエンジンごとに、得意な分野や言語ペアがあります。
  • 訓練データの質と量:機械翻訳の品質は、訓練データの量と質に左右されます。データの質を上回る結果が得られることは基本的にはありません。逆に言うと、高品質化の鍵は、ターゲットとなる分野について質の高い対訳データをいかに大量に用意できるかにあるといえます。現在、高い評価を得ている機械翻訳エンジンは、良質な対訳データを大量に保持していたことが成功要因のひとつだと言われています。

人間と機械翻訳のコラボレーション「ポストエディット」

このような特性を考えたときに、現実的なソリューションとして浮上してくるのが、人間と機械翻訳のコラボレーションです。もちろん、機械翻訳を単独でも使用できますが、品質面でリスクを伴います。それを人間の力で補ったり、または人間の翻訳を支援する道具として機械翻訳を使うという方法が、現在のビジネスでは主流となりつつあります。

具体的には、まず機械翻訳(MT)で訳文を出力し、それに対して人間が後編集(ポストエディット)を行うMTPE(機械翻訳ポストエディット)というワークフローが登場しています。

MTPEの中にも、情報の間違いがないか人間が最低限の確認を行う「ライト」から、機械翻訳の出力はあくまで参考用として、人間の翻訳者が主導的に翻訳・編集を行う「フル」まで、いくつかのレベルがあります。

目的に応じて、たとえば、情報の正確性を担保しながらスピードを重視する技術文書などの場合は「ライト」を使い、読者の共感を呼んだり、興味を喚起したりするストーリー型コンテンツの場合は「フル」で行うといったように、目的に応じて方法をチューニングしていくのが成功の秘訣だといえます。

どの機械翻訳エンジンを選ぶべき?

研究開発の進展に伴い、現在さまざまな企業・機関から機械翻訳エンジンがリリースされています。それぞれに特徴があるため、業務に機械翻訳を導入する際には、どのエンジンを選ぶかが結果を左右するひとつのポイントになってきます。主に以下の2つの視点から最適なエンジンを検討しましょう。

  • 言語ペア:どの言語からどの言語への翻訳に用いるのかによって、同じエンジンでも結果品質に差が出てきます。特定の言語に強いものから、比較的万能なタイプまで、エンジンによって得意とする言語ペアが異なります。
  • 対象分野:医療、技術、法律、ビジネス、IT、エンターテインメントなど、対象とする分野によっても、エンジンの得意・不得意があります。

機械翻訳の力を最大限に引き出すには?「翻訳管理システム」の活用

ここまで見てきたように、実際のビジネスでの運用では、目的に応じて、機械翻訳、人手翻訳、ポストエディットを柔軟に使い分けていく必要があります。それを効率的に行う際に役立つのが「翻訳管理システム(TMS)」です。

翻訳管理システムでは、機械翻訳だけでなく、翻訳支援(CAT)ツール、翻訳メモリ、用語ベース、ワークフロー管理、外部リンギスト(翻訳者・校正者)のタスク管理、サードパーティツールとの連携といった業界標準の機能群が統合されており、ひとつのプラットフォームで、翻訳業務のすべてをわかりやすく管理できるようになっています。チームでの管理や会社を越えたコラボレーションにも便利です。

さらなる飛躍に向けて

今回は機械翻訳について見てきました。現在のビジネスでは、機械翻訳ができること、課題になっていることを冷静に見極め、求められる結果に応じて、人間と機械が効果的に協調作業できる方法を探っていくことが、ベストソリューションにつながると考えられます。

機械翻訳は、今日もさらなる飛躍を目指して、さまざまな機関で活発に研究開発が進められています。最新のベストプラクティスをいかに早くスムーズに取り込んでいくかも、今後のグローバルビジネスの成功を導く重要なポイントになっていくでしょう。