機械翻訳
ポストエディットとは? それが必要な理由とメリット、注意点、具体的な手順
「ポストエディット」という言葉を聞いたことのある方は、どれくらいいらっしゃるでしょうか? すでに翻訳業務に関わっている方はご存知かと思いますが、それ以外の業界の方はまだ馴染みがないかもしれません。歴史的にはごく最近に登場したポストエディットについて、それが必要な理由やメリット、注意点、具体的な手順などを見ていきます。
ポストエディットとは?
ポストエディットとは英語でPost Edit、つまり「後編集」を意味します。何の「後」かというと、機械翻訳(MT:Machine Translation)の後です。そして誰が「編集」するかというと、人間です。つまり、機械翻訳エンジンから出力された翻訳文を人間が編集、手直しすること、その工程をポストエディットと呼びます。当然ながら、ポストエディットは機械翻訳の浸透以降に登場した言葉です。業界では略して「PE」、または機械翻訳+ポストエディットの略として「MTPE」と呼ばれることもあります。
業務において、どの程度このポストエディットを行うかについて、「ライト」と「フル」のポストエディットに分けられることがあります。最低限のチェックと手直しを行うのがライトポストエディット(LPE)、さまざまな背景や目的を考慮して入念な編集を行うものがフルポストエディット(FPE)です。ただ、実際のビジネスでは、必ずしもライトとフルの区分が明確なわけではありません。ポストエディットを行う程度によって、かかる時間や訳文の質が変わってくるという認識で捉えておくとよいでしょう。
なぜ、ポストエディットが必要なのか?
背景には、機械翻訳の品質がまだ完璧ではないことがあります。ニューラル機械翻訳の登場により、近年の機械翻訳は飛躍的な進歩を遂げたため、ほぼ完璧に訳すのでは?と思う方もいらっしゃるでしょう。
一般的な視点ではそう言えますが、信頼が求められる実際のビジネスにおいては、まだそのまま使えるものではないのが現状です。車の自動運転でも、いくら「ほぼ」完璧に走るようになっても、人間がすぐにサポートできる体制などの備えは欠かせません。機械翻訳も同じく、手放しで使うことは、現在の社会やビジネスの現場ではまだ難しいといえます。そこで機械翻訳の質を補う方法として、ポストエディットが登場しました。
具体的にポイントとなるのは、「正確性」と「自然さ」です。
正確性の確保
まず重視すべきなのが、正確性です。機械翻訳は精度が上がってきたとはいえ、実際に、意味が正反対になっていたり、固有名詞が別のものと入れ替わっていたりといった、人間には考えられないミスが起こるケースがあります。とくにニューラル機械翻訳では流暢な訳文が生成されるため、逆にミスに気づきにくい面があります。自然な文章としてすっと読めてしまう分、重大な間違いがあっても受け入れられてしまうリスクがあるのです。
流暢だけれど内容が間違っている文章と、多少ぎこちないけれど情報としては正確である文章では、信頼が求められる社会ではどちらが重要かは明らかです。自動車と同様、翻訳もまずは安全第一で考えるのがよいのではないでしょうか。そのために人間による、原文と照らし合わせたチェックや手直しが必要になります。
自然さの確保
もうひとつが、人間が書いた文章としての自然さです。機械翻訳は、歴史や文化といった背景を考慮した訳し分けは苦手としています。そのため、目的に応じた適切な文章、人間らしい文章にするには、やはり人間の目で編集し直していく作業が必要になります。
また、これは機械翻訳に限りませんが、翻訳システムを使った翻訳では、どうしても文章(セグメント)単位で意味を合わせていくアプローチがとられがちです。人間によるポストエディットも全体のバランスを見ながら行うことで、ひとつの文書として、より自然な流れを構築でき、人間に伝わりやすい文章になります。これはトランスクリエーションもしくはリライトの領域に入ってくるかもしれません。
ポストエディットのメリットとは?
機械翻訳+ポストエディットの組み合わせによる主なメリットは、時間を節約できることと、翻訳の質が向上することです。
時間を節約できる
前述の通り、機械翻訳の正確性にはまだ課題があるため、ポストエディットでも、従来の人手翻訳と同様に、翻訳者(リンギスト)が自分で原文をしっかり読み、意味を理解する必要があります。この工程の時間は変わりません。
その上で、翻訳者が自分で訳文を考案し、それをタイピングする工程と、機械翻訳から出力された文章をもとに編集を行なう工程の時間の差が、最終的に節約できる時間となります。
ただ、自分が書いたものではない文章を直すのは、翻訳するより時間がかかるという翻訳者もいます。時間の節約を図るには、ポストエディット作業に合った翻訳者を見つけることもポイントになってくるでしょう。
一方、従来の校正作業が不要になるかどうかは、一概には言えません。人間はミスをするものなので、従来の人手翻訳では翻訳者と校正者のペアで担当する2人体制が標準でした。ポストエディットも人間が行う作業である以上、基本的には同様のチェック体制をとるのが望ましいでしょう。編集箇所がほぼないようなケースでは1人体制でも問題ないかもしれませんが、より複雑な内容ではやはり校正・レビューの工程を確保するのがよいと思われます。
翻訳の質が向上する
前述の通り、機械翻訳はまだ正確性の面で課題があり、人間のように目的や背景を考慮した上で翻訳を行なっているわけでもありません。そのため、翻訳者が原文と照らし合わせて訳文を確認し、目的に応じて編集を行うことで、正確性を担保した自然な文章を生み出せます。
現地の文化に即したメッセージを発信し、ブランド価値を高めていくローカライズ戦略においても、機械翻訳のままでは顧客の心を十分に掴めないことがあるでしょう。経験豊富なリンギストが編集を行うことで、より人間味があり、共感を呼ぶコンテンツを生成できます。
ポストエディットの注意点とは?
機械翻訳の質や適性を確認する
実際に時間を節約できるかどうかは、機械翻訳の出力の質にも左右されます。目的に対して要求を満たす出力が得られ、ほぼ手直しの必要がないような場合は、大きな時間節約となります。一方、機械翻訳の質が十分でなかったり、エンジンの得意分野に合致していなかったりして、一から翻訳し直す方が良いレベルなら、人手翻訳よりもコストがかかってしまいます。そのため、まず機械翻訳の質や適性を見極め、対象とする内容がポストエディットに適したものであることを確認した上で、導入するのがよいでしょう。
適性のある翻訳者に依頼する
品質向上の鍵となるのは、最適な翻訳者(リンギスト)に依頼することです。機械翻訳+ポストエディットでコストを抑えられるとされていますが、最終的な成果物の質が下がることを受け入れるのでなければ、それは翻訳者の質を下げてよいという意味ではありません。原文を正確に理解する力に加えて、機械翻訳エンジンの仕組みや特性などの知識も求められるため、従来の翻訳者プラスアルファの技能が必要になってくるとも言えます。実際、ISOでポストエディットについての要件が定められているのも、従来とは異なるスキルの必要性が背景にあると考えられます。
文章の魅力を増すための工夫をする
機械翻訳+ポストエディットの課題のひとつとして、表現が単調になることが指摘されています。基本的に機械翻訳は、表現の豊かさは考慮していません。また、人にとっても、いったんある文章が頭に入ってしまった後に、改めて全く別の表現を思いつくのは簡単ではありません。そのため機械翻訳+ポストエディットでは、機械翻訳の出力に引きずられた文章になる傾向があります。そのため定期的に第三者がチェックしたり、リンギストがより創造的な文章を生み出す工夫をしたりして、目的にあった文章、わかりやすい文章、魅力的な文章にしていく必要があるでしょう。
ポストエディットの手順
では、機械翻訳+ポストエディットの手順を整理してみたいと思います。
まず、機械翻訳を行う前に原文をプリエディット(前編集)しておくことで、出力結果を改善できるとされています。
プリエディットとは?
プリエディットとは、原文を機械翻訳エンジンが扱いやすい形に前編集(Pre-edit)しておくことで、出力結果を改善する方法。具体的には、省略されている主語を補ったり、文法に則ったシンプルな構文にしたりして、その文章だけで過不足なく意味が伝わるように書き換えることが、効果的だとされています。とくに比較的短い文章の翻訳を機械翻訳だけで完結させたい、という場合には、プリエディットは有効でしょう。
ただ、実際のビジネスの現場では、多量の文章を手作業でプリエディットする手間を考えると、翻訳者に十分時間をかけてポストエディットしてもらった方がよいかもしれません。なお、不適切な箇所で改行されていないかなど、ファイルや文章の体裁に関する事前チェックは、機械翻訳に限らず必要です。
機械翻訳+ポストエディットの具体的な手順
- 最適なエンジンを選んで、機械翻訳を行う
- 出力された訳文を翻訳者に渡して、ポストエディットを依頼する
- 受け取った翻訳者は、原文を読み、内容を理解する
- 機械翻訳エンジンから出力された訳文を見て、原文の意味、情報が正確に反映されていることを確認する
- 正しくない部分があれば、その箇所を修正し、対象言語の表現として著しく不自然な箇所があれば手直しする
このあたりまでが、いわゆるライトポストエディットだと考えてよいでしょう。
- 原文のトーンや、背景・文化、わかりやすさ、読みやすさなども含めて、訳文を見直し、編集する。表記や用語の統一、固有名詞の表記の正しさ、顧客等への言葉づかい、時代背景、多様性への配慮なども考慮し、必要に応じてリサーチを行う
- 文章全体を通して見て、人間が書いた文書として不自然な流れや言葉の使い方がないか、文章の目的に応じた内容になっているかなどを確認して、手直しを行う
このあたりの、通常の翻訳者が行うレベルにできるだけ近づけるのが、フルポストエディットです。ただ質の高さを目指すほど、時間的に節約できる部分が少なくなってくるため、機械翻訳エンジンの商用利用も無料ではないことを考えると、コスト面ではそれほど大きな削減につながらない場合もあります。
- その後、必要に応じて校正者・レビュアーによるチェックを行う
ポスト・ポストエディットとは?
時間と経験を積み重ねることで、継続的にポストエディットの品質を向上させていけます。具体的には、データとフィードバックを活用して改善を図ることができます。この工程をポスト・ポストエディットと呼びます。
データを活用する方法として、ポストエディット作業を解析するツールが登場しています。これにより、翻訳を完了させるまでに実際にどのくらいのポストエディット作業が行われたかを算出できます。セグメントごとに分析できるため、とくにどの箇所で多くの編集が必要だったかという情報も得られます。このような解析結果をもとに、原文の調整を行ったり、作業者に有用な参考資料を提供したりすることで、今後のプロジェクトでの精度や効率を高めていけます。
またデータの解析に加えて、主要な関係者からのフィードバックも重要です。クライアントの担当者やプロジェクトマネージャー、コンテンツクリエイターから意見を集めて、良い点や改善が必要な点を把握することで、成果物の質を高めていけるでしょう。
ポストエディットに便利なツールとは?
実際のビジネスで、多くの文章に対してポストエディットを効率的に行うには、テクノロジーの力を借りるのが効果的です。現在の翻訳ビジネスの主要ツールになっている「翻訳管理システム(TMS)」は、翻訳作業はもちろん、プロジェクトやリンギストのワークフローも一元管理でき、ポストエディット作業にも最適です。具体的には以下のような点で役立ちます。
- 過去の訳文を確認・流用できる「翻訳メモリ」、用語の訳の統一に役立つ「用語ベース」などの機能を活用することで、ポストエディット作業の質と効率が向上します。
- 品質保証(Quality Assurance)機能は、原文と訳文内の数値の相違など、間違いが疑われる箇所を自動で指摘。人間による編集作業時のケアレスミスを防ぎます。
- 機械翻訳エンジンとの連携が容易。APIの設定なしで連携が可能な「フル接続」対応のエンジンでは、ワンクリックでエンジンを有効にして、すぐに出力を取り込めます。とくにクラウド型の翻訳管理システムでは、アップデート等の必要なく、常に最新のエンジンに簡単にアクセスできます。
- 機械翻訳自動検出機能は、原文の内容を解析して、そのコンテンツに最適な機械翻訳エンジンを自動的に選択。どのエンジンを選んでいいかわからないときに便利です。
- 機械翻訳品質評価(MTQE)機能では、AIを用いて各機械翻訳エンジンの品質を自動判定し、翻訳セグメントごとにスコアを表示。一定スコア以上のものは自動的に流し込んだり、事前に確定しておいたりするなど、効率アップにも役立ちます。
- 機械翻訳エンジン向け用語集(MTグロッサリー)では、特定の用語を事前登録しておくことで、機械翻訳の出力時に、指定された訳語が自動で反映されるようになります。
- 以前に翻訳したコンテンツを使用してエンジンを訓練(MTデータクリーニング)することで、機械翻訳をカスタマイズできます。
- 上述の「ポスト・ポストエディット」のデータ解析を行い、結果を次のプロジェクトに生かして品質や効率を高めていけます。
今後のポストエディットの行方は?
今回はポストエディットについて、その目的やメリット、注意点、具体的な手順などを見てきました。
機械翻訳は今や誰もがその存在を知るほど、目覚ましい発展を遂げました。日常で、とくに個人的な情報収集に使う場合などは、極めて便利なツールです。ただ、信頼が求められるビジネスでそのまま使うには、まだ越えられないハードルがあります。それを機械と人間が手を取り合って乗り越えていくアプローチのひとつが、機械翻訳+ポストエディットなのです。
翻訳に限らず、機械と人間の協調はこれからの社会の重要テーマとなっていくでしょう。その最前線のひとつとして、より良い機械翻訳+ポストエディットを目指して取り組む企業が増え、そこから新しいブレイクスルーが生まれることを期待します。