
ローカライズ戦略
機械翻訳
「最近の翻訳は機械がやってくれるんでしょう?」「AIによって翻訳者の仕事がなくなる」……そんな声を耳にしたことのある人も多いのではないでしょうか。そこにはややイメージが先行している面があるかもしれません。
業務に機械翻訳の導入を検討しようとしている方、今後のビジネスの海外展開に向けて基本的なことを押さえておきたい方、そんな方々に役立つ内容になれば幸いです。
「機械翻訳」とは文字通り、人手を介さず機械が行う翻訳のことです。英語でも同様にmachine translationと呼ばれ、翻訳業界では「MT」という略称がしばしば使われます。これに対して、従来の人間が行う翻訳のことを「人手翻訳」「人力翻訳」と呼ぶことも増えてきました。携帯電話の登場により、それまでの電話が「固定電話」と呼ばれるようになったのと同じ現象ですね。そこまで機械翻訳が浸透してきたことの証だとも言えそうです。
機械翻訳と似た文脈で使われる用語に「自動翻訳」があります。これらはどう違うのでしょうか?
自動翻訳(automated/automatic translation)とは、一般に、翻訳業務における反復作業を自動化するプロセスを指して使われる用語です。翻訳自体はもちろん、ファイルの前後処理や他のシステムとの連携などを含めた、ワークフロー全体を自動化するイメージです。つまり、自動翻訳を実現する要素のひとつとして「機械翻訳」があるという位置づけになります。実際の業務では、翻訳支援ツールや翻訳管理システムを使って、ワークフローの自動化が行われています。
なお、とくに日本では、主に音声を使ったリアルタイム翻訳を指して自動翻訳と呼ぶこともあるようです。音声翻訳の場合でも、まず音声認識により文字化して、それを翻訳し、再び音声に戻して出力するという処理がなされることが一般的ですので、この場合もやはり、自動翻訳プロセスの中で機械翻訳が行われていると言えます。
まとめると、機械翻訳は自動翻訳を実現するために欠かせない要素のひとつ、ということです。
機械翻訳はどのような変遷をたどってきたのでしょうか?
機械翻訳の開発は、1950年代初頭に始まったと言われています。背景にあったのは、コンピューターの発達です。開発者はその計算能力を翻訳に活かそうと考えました。
最初にとられたアプローチは、ルールベース機械翻訳です。これはその名が示すように、人間が定義したルールと辞書に基づいてコンピューターが計算処理をし、翻訳文を出力するもので、いわば人間がコンピューターに文法を教えるような方法です。ただ、すべてを簡単に定式化できるほど翻訳は単純ではなく、複雑な計算を行うには、当時は機械の処理能力やデータの保存容量も十分ではありませんでした。
その後、さらなるコンピューターの発展と扱えるデータ容量の増加を受け、いわゆるビッグデータを活用しようという発想から生まれたのが統計的機械翻訳です。これは大量の対訳(原文と訳文のペア)データを統計的に解析し、最も頻度の高い訳語を採用しようというアプローチです。
やがて2000年代に入り、インターネット時代を迎えます。ネットワーク化された仮想空間には各国言語による大量の文章データが保存され、コンピューターの処理能力やストレージ容量も指数関数的に増大していきました。インターネット上には人間の読書量を遥かに凌ぐ量のテキストデータがあります。そのデータの力を活用することで、機械翻訳の質が向上していきます。
そして2016年、ニューラル機械翻訳が登場。新たなブレイクスルーが起こります。人間の脳内で神経細胞が行っている情報処理を模したこの手法により、極めて自然な翻訳文が出力されるようになり、人々を驚かせました。入力した文章に対してどのような訳文が出てくるかは開発者でもわからないといい、より「AI」のイメージに近づいたとも言えます。現在は、このニューラル機械翻訳が業界での主流となっています。
このように機械翻訳は、当初の人間が機械に法則を「教える」方法から、機械が自律的に「学習する」段階へと変遷を遂げてきたのです。
改めて、先ほどの機械翻訳の3つのアプローチを整理しておきましょう。
人間があらかじめ定義した文法や構文の規則に基づいて、コンピューターが翻訳を行う方法。機械翻訳の元祖とも言える存在ですが、そのまま使えるレベルの訳文を出力することは難しく、今では過去の手法とみなされることが多くなっています。
大量の対訳データ(コーパス)をもとに、コンピューターで単語やフレーズの関係を統計的にモデル化し、出現頻度の高いパターンを採用するアプローチ。技術、医療、金融など、分野固有のデータを用意できれば、現在でも質の高い翻訳を生成できるとされています。
人間の脳の神経細胞で行われている処理を模倣した仕組みで翻訳を行う方法。一単語ずつ翻訳するのではなく、文章をいったん数値化してシステムに取り込み、ニューラルネットワークで処理を行なった後、新たに文章を書き出します。そのため、他の方法に比べて、極めて流暢な出力が得られることが特徴です。現在、業界で主流となっている方法で、AI翻訳などと呼ばれるものも、多くはこの手法を指します。
機械翻訳には以下のようなメリットがあります。**
では、機械翻訳は完璧なのでしょうか? いえ、何事にも良い面があればデメリットもあるのが世の常です。機械翻訳には以下のような課題があります。
このようなメリット、デメリットを考えた上で、機械翻訳と人手翻訳をどのように選択していけばよいでしょうか? まず、機械翻訳の品質は、次のような要因によって差が出てきます。
このような特性を考えたときに、現実的なソリューションとして浮上してくるのが、人間と機械翻訳のコラボレーションです。もちろん、機械翻訳を単独でも使用できますが、品質面でリスクを伴います。それを人間の力で補ったり、または人間の翻訳を支援する道具として機械翻訳を使うという方法が、現在のビジネスでは主流となりつつあります。
具体的には、まず機械翻訳(MT)で訳文を出力し、それに対して人間が後編集(ポストエディット)を行うMTPE(機械翻訳ポストエディット)というワークフローが登場しています。
MTPEの中にも、情報の間違いがないか人間が最低限の確認を行う「ライト」から、機械翻訳の出力はあくまで参考用として、人間の翻訳者が主導的に翻訳・編集を行う「フル」まで、いくつかのレベルがあります。
目的に応じて、たとえば、情報の正確性を担保しながらスピードを重視する技術文書などの場合は「ライト」を使い、読者の共感を呼んだり、興味を喚起したりするストーリー型コンテンツの場合は「フル」で行うといったように、目的に応じて方法をチューニングしていくのが成功の秘訣だといえます。
研究開発の進展に伴い、現在さまざまな企業・機関から機械翻訳エンジンがリリースされています。それぞれに特徴があるため、業務に機械翻訳を導入する際には、どのエンジンを選ぶかが結果を左右するひとつのポイントになってきます。主に以下の2つの視点から最適なエンジンを検討しましょう。
ここまで見てきたように、実際のビジネスでの運用では、目的に応じて、機械翻訳、人手翻訳、ポストエディットを柔軟に使い分けていく必要があります。それを効率的に行う際に役立つのが「翻訳管理システム(TMS)」です。
翻訳管理システムでは、機械翻訳だけでなく、翻訳支援(CAT)ツール、翻訳メモリ、用語ベース、ワークフロー管理、外部リンギスト(翻訳者・校正者)のタスク管理、サードパーティツールとの連携といった業界標準の機能群が統合されており、ひとつのプラットフォームで、翻訳業務のすべてをわかりやすく管理できるようになっています。チームでの管理や会社を越えたコラボレーションにも便利です。
今回は機械翻訳について見てきました。現在のビジネスでは、機械翻訳ができること、課題になっていることを冷静に見極め、求められる結果に応じて、人間と機械が効果的に協調作業できる方法を探っていくことが、ベストソリューションにつながると考えられます。
機械翻訳は、今日もさらなる飛躍を目指して、さまざまな機関で活発に研究開発が進められています。最新のベストプラクティスをいかに早くスムーズに取り込んでいくかも、今後のグローバルビジネスの成功を導く重要なポイントになっていくでしょう。
最後の更新:8月 14, 2023