DeepLを使った機械翻訳の探求:その仕組みと精度

DeepLは、世界中の主要な機械翻訳のプロバイダーの一つです。その仕組み、利点と欠点、そして最大のパフォーマンスと効率を得るためにどのように使用するかを探ってみてください。

効率的で正確なコミュニケーションを言語間で可能にするという約束は、機械翻訳(MT)の開発の原動力となってきました。1950年代に始まった実験的な試み—翻訳はコンピュータの力の最初の応用の一つでした—は、21世紀には実用的な生産性ツールとなりました。

今日、AI駆動の機械翻訳ツールは、グローバルなビジネスオペレーションを革命的に変えています。主要なMTプロバイダーの一つは、ドイツに本拠を置くニューラル機械翻訳(NMT)技術プロバイダーのDeepLです。このガイドでは、DeepLの仕組み、その利点と欠点、そしてプロフェッショナルな翻訳プロジェクトでの利用に関するベストプラクティスを探ります。

DeepLとは何ですか?簡単な概要

DeepLは2009年にドイツでLingueeとして設立され、従来の統計的機械翻訳(SMT)よりもはるかに高品質な翻訳を生成できるニューラル機械翻訳システムを作成することを目指しました。

DeepLのエンジニアは、最新の深層学習技術—それが会社名の由来です—を適用して、Lingueeのデータベースにある既存のデータでモデルを訓練しました。

2017年以降、DeepLは非常に人気を博し、これまでに10億人以上がそのサービスを利用しています。28言語のサポートを提供し、650の翻訳の組み合わせが可能です。

ユーザーは、DeepLの無料版と有料版、ウェブインターフェースとスタンドアロン型翻訳ツールの間で選択できます。無料版は個人使用に適しており、有料版は企業向けにより多くの機能を提供します。

DeepLはもはや単なる翻訳サービスではありません。今では、テキスト生成に焦点を当てた人工知能にも挑戦しています。2023年初頭に発表された最新のサービス、DeepL Writeは、英語ライティング支援ツールとなり、Grammarlyなどの競合を上回ることを目指しています。

DeepLはどのように機能しますか?

すべての機械翻訳が同じように作られているわけではなく、時間が経つにつれて、システムはますます洗練されてきました。2016年まで、MTシステムはルールベース(多数の手動で作成されたルールに依存)または統計ベース(多言語コーパス(大規模な並行テキストの集まり)に基づいて翻訳)であり、単語ベースまたはフレーズベースの方法で統計的パターンを探していました。

現在、ほとんどの主流のMTシステムはニューラルネットワークを使用しています。これはニューラル機械翻訳と呼ばれ、プログラムのニューラルネットワークが出力文を生成する際に、翻訳された用語の両側の数語ではなく、各ステップで全入力文を考慮に入れるエンドツーエンド学習の一形態です。

DeepLはNMTシステムの一例であり、深層学習アルゴリズムのおかげで、統計的MTエンジンによって生成されたものよりも人間らしい翻訳を生成します。そのネットワークアーキテクチャは、膨大なデータから学習し、新しいコンテキストに適応することを可能にします。

DeepLの機能を分析する

前述のように、DeepLのコアの強みはそのNMTシステムにあり、従来の統計的MT手法と比較して、より正確で自然な翻訳を生成することができます。その最も顕著な機能のいくつかを見てみましょう:

  • 複数言語のサポート:DeepLは、英語、スペイン語、フランス語、ドイツ語、中国語、日本語など、幅広い言語間の翻訳をサポートしています。ユーザーは、異なる言語ペア間で別々のツールを必要とせずにシームレスにテキストを翻訳できます。
  • コンテキストの認識:DeepLが採用しているAIエンジンは、入力テキストのコンテキストを理解し、翻訳がより文脈的に正確で意図された意味を維持することを目指しています。これは、慣用表現や複雑な文を扱う際に有益です。
  • 翻訳品質DeepLは特定の言語ペアに対する翻訳品質で知られており、ユーザーから高く評価されています。そのコンテキストを把握し、正確な翻訳を提供する能力は、専門家や言語愛好者の両方に評価されています。
  • 翻訳者プラグインとデスクトップアプリ:DeepLは、Microsoft Officeを含むさまざまなアプリケーションと統合できるブラウザプラグインを提供しており、使用中のプログラムを離れることなく直接テキスト翻訳を行うことができます。また、最も人気のあるオペレーティングシステムにデスクトップアプリをダウンロードすることもできます。
  • ドキュメント翻訳機能:テキスト翻訳に加えて、DeepLはユーザーが翻訳のために全体のドキュメントをアップロードできるようにし、多言語コンテンツを扱う個人や企業にとって便利な機能を提供します。
  • データプライバシードイツに拠点を置くDeepLは、欧州連合のデータ保護法の対象です。同社はDeepLの無料機械翻訳ツールでのデータ処理について多くを語っていませんが、すべてのDeepL Proサブスクライバーがすべての翻訳に対して安全で暗号化された接続を享受でき、翻訳が完了した後はデータがサーバーに保存されないことを明確にしています。
  • API統合DeepLは、開発者がその翻訳サービスをアプリケーション、ウェブサイト、またはサービスに統合できるAPIを提供しており、エンドユーザーにシームレスな翻訳体験を提供します。

DeepLの主要な競合他社は何ですか?

機械翻訳ツールの宇宙は広大で多様です。DeepLの他に、最もよく知られているMTプロバイダーには以下が含まれます:

Google Translate

2006年に開始されたGoogle翻訳は、2016年に統計モデルからNMTモデルに切り替えました。これはDeepLが開始される数ヶ月前のことです。

それは133の言語をサポートしており、使用は無料です(自分のウェブサイトを翻訳するためのAPI使用や、月に500,000文字を超える場合を除いて)。その非常にアクセスしやすいインターフェースと直感的なデザインにより、カジュアルユーザーに人気の選択肢となっています。さらに、ウェブサイト全体を翻訳したり、画像や音声も翻訳することができます。

Systran Translate

1968年に設立されたSystranは、市場初の商用MTソフトウェアでした。Systranは、ニューラル機械翻訳とニューラル系列学習のためのオープンソースエコシステムを持つ唯一の企業でもあります:OpenNMT

Systran Translateは50以上の言語をサポートしており、ユーザーは自分の用語集、辞書、コーパスを追加して出力をパーソナライズできます。

Microsoft Translator

Bing(Microsoftの検索エンジン)に統合され、Microsoft Officeアプリケーションの組み込み機能として提供されているMicrosoft Translatorは、2009年にリリースされ、最新のニューラルネットワーク技術(注意機構モデル)に基づいています。

現在では、iPhoneとAndroidデバイスの両方のスタンドアロンモバイルアプリとしても利用可能です。それは100以上の言語をサポートし、音声とテキストの翻訳を可能にします。

Amazon Translate

この分野で最も若いプレーヤーの一つであるAmazon Translateは、2017年にリリースされました。それはニューラル機械翻訳エンジンを使用しており、その短い歴史の中で印象的なパフォーマンスレベルを達成しています。

ユーザーは、Amazon Translateが提供する機能の範囲にアクセスするためにAWSアカウントが必要です—カスタマイズ(用語と並列データ)、用語のエンコーディング、バッチ翻訳(Amazon S3)などを挙げることができます。

Tencent機械翻訳

Tencent機械翻訳(TMT)は、市場に新たに参入したサービスの一つです。現在、10言語をサポートしており、ニューラルと統計的機械翻訳モデルの両方を組み合わせています。

Tencent機械翻訳は特に中国語の能力が注目されており、英語から中国語への翻訳で最高記録の人間評価スコアを取得し、中国語から英語への翻訳で最高の自動スコアを得ています。

DeepL対Google翻訳:どちらが優れていますか?

DeepLはGoogle翻訳より優れていますか?この質問への答えは、他の何事と同様に、文脈とユーザーの特定のニーズに依存します。一般的に言えば、DeepLはGoogle翻訳よりも正確なMTエンジンと見なされることが多いです。

とはいえ、いくつかの制限があります:DeepLの言語選択はGoogleよりも限られており、元のフォーマットを保持した完全なドキュメント翻訳や、正式と非公式のレジスタの選択など、すべての機能にアクセスするにはプレミアムアカウントが必要です。

DeepLが提供する機能の一つで、ユーザーがGoogle翻訳から得られないのは、出力ボックス内の翻訳された単語をクリックして、迅速に代替翻訳を表示できることです。DeepLが提案した翻訳とは異なる翻訳を選択すると、残りのテキストは自動的にあなたの選択を反映するように更新されます。

セキュリティ面では、無料版の場合、Google翻訳とDeepLの両方が翻訳したテキストの履歴を保持します。対照的に、DeepL Proは世界最高水準のデータ保護基準を提供し、翻訳後すぐにテキストを削除します。これにより、特に機密性の高いコンテンツに適しています。

全体として、両方のプロバイダは機械翻訳のための有用なソリューションを提供しています。もし、カスタマイズする必要のない幅広い言語オプションを持つ安価で使いやすい翻訳ツールを探しているのであれば、Google翻訳がより良い選択かもしれません。一方で、カスタマイズ可能でデータの保護が確実な高精度の翻訳が必要な場合、DeepLがより良い選択肢となるでしょう。

DeepLの精度とパフォーマンスの評価

機械翻訳エンジンの精度を確立することは、非常に困難であることが知られています。結果は、関与する言語ペア、翻訳するテキストの種類(高度に専門的な金融文書はブログ投稿とは異なります)、および必要なカスタマイズのレベルによって異なります。

さらに、言語は動的であり、著者の意図した意味などの要因は測定できないため、精度は相対的な定義を持ちます。例えば、小説の文法と句読点の精度に対する期待は、ソーシャルメディアの投稿に対する期待とは異なります。

とはいえ、ウェブ上の一般的な感情に基づいて、ユーザーはDeepLが非常に正確である傾向があると報告しています。特にヨーロッパの言語ペアに関しては。DeepL自身の実験がこれを裏付けています。ただし、会社がデータを提示する方法が偏っていると見なされる可能性があるため、精度のより信頼できる指標はユーザーフィードバックです。これは主に以下の点で肯定的です:

  • イディオムとスラングの解釈と同等性
  • 自然さ
  • 文体に配慮した翻訳

結局のところ、各ユーザーは自分のユースケースでDeepLがどのように機能するかを試した上で、最終的な判断を下すことになります。良いニュースは、無料版なら追加費用なしでそれを実行できるということです。

Machine transtion report key visual | Phrase

Interactive MT report: Uncover top performers

Find out how leading machine translation engines perform for different content types using the latest data in our quarterly machine translation report.

DeepLの長所と短所

DeepLのようなニューラル機械翻訳システムは、多くの可能性を広げます。DeepLは、主要なNMT技術ベンダーの1つとして、以下のような特徴があります。

  • かなり正確:単語やフレーズの広い文脈を理解し、より正確で流暢な翻訳を生成し、時間とともに改善されます。
  • 学習が高速:従来の機械翻訳に必要な高価で主に手動の方法とは異なり、自動化されたプロセスによってニューラルネットワークを迅速にトレーニングできます。
  • 柔軟で簡単に統合できる:API、拡張機能、プラグインを利用して、ほとんどのブラウザやソフトウェアに統合し、多くのコンテンツのファイル形式に適用できます。
  • カスタム可能:通常、DeepLの出力は用語集やブランド固有の用語データベース、その他のデータソースを通じてカスタマイズでき、結果を改善できます。
  • コスト効率が高い:他のNMTエンジンと同様に、DeepLは非常に正確で迅速な翻訳を、わずかなコストで実現します。
  • スケーラブル:翻訳のニーズが拡大する際、DeepLは増加する需要に簡単に対応できます。

とはいえ、DeepLの開発は大きな高みに達しましたが、ほとんどの機械翻訳エンジンが完璧になることはほとんどないでしょう。そして、DeepLは人間レベルの精度に追いつくまでにはまだ道のりがあります。

今後数年間でDeepLがどれだけ改善されるかはまだ見えず、予測するのは難しいです。現時点では、依然として人間レベルのスキルには及びません。具体的には:

  • 質問をすること
  • 文脈を理解すること
  • 原文の誤りを特定すること
  • 皮肉を捉えること
  • 創造的に翻訳すること
  • 考慮した選択をすること
  • リサーチを行うこと
  • 一貫性を確保すること
  • 完全性を保証すること
  • 意図的に情報を省略または含めること
  • 注釈やメモの追加

機械翻訳エンジンがこれらのタスクを処理する能力は限られていますが、手動のポストエディットは今後も翻訳ワークフローの重要な部分であり続けるでしょう。

DeepLを利用したプロフェッショナル翻訳:ベストプラクティス

DeepLを機械翻訳に使用する際は、品質を損なうことなく最大限の効果を得られる使用ケースに従うことが重要です。これらには以下が含まれます。

  • 低可視性または低トラフィックのコンテンツ、内部メモ、ウェブサイトのフッター、メール、感情分析用のソーシャルメディア投稿など。
  • 繰り返し使用される技術的コンテンツ、実際に操作可能である必要があるもの、例えば取扱説明書のようなもの—可能であれば、ユーザーエクスペリエンス上の問題を回避するために人間の翻訳者によるポストエディットを実施してください。
  • 低リスクのコンテンツ、完全に正確である必要がなく、複雑な規制に従う必要がないもの—良い例は、消費者が高品質を期待しない製品レビューのようなユーザーが作成したコンテンツです。
  • 短命なコンテンツ、チャットやメールサポートメッセージ、お客様からの問い合わせなど。
  • 大量のコンテンツ、迅速な納期が必要なもの、例えば、すぐに公開する必要がある数百の製品説明など。
  • 頻繁に修正されるコンテンツ—機能や情報の更新などが該当します。

これらの使用ケースのほとんどは、正確性と明確性を確保するために軽い機械翻訳ポストエディット(MTPE)を必要とし、コンテンツがミッションクリティカルでない場合は、生の出力を使用することも可能です。

より高い正確性が求められる他のタイプのコンテンツは、より時間を要するポストエディットが必要です。その中には、次のものがあります:

  • 製品名:それらは非常に情報量が多く簡潔であり、固有名詞や多義語を含む傾向があり、語順が比較的自由であるため、曖昧さを引き起こす可能性があります。
  • 異なる構文の言語ペア間の翻訳:例えば、日本語とスペイン語は、機械翻訳エンジンにとって適切な文を形成するのがより難しくなる単語やフレーズの並べ替えを伴います。
  • 顧客体験に影響を与える中程度の可視性のコンテンツ:ナレッジベース、FAQ、アラートなどは、効率的な顧客サポートの目標を達成するためにできるだけ正確である必要があります。
  • バックエンドSEOメタ情報:画像のaltテキストやキャプションなどの一部のSEO要素は可視性が低いですが、検索ランキングを改善するためにターゲット言語のキーワードなどの技術的最適化が必要です。

DeepLを翻訳技術で最大限に活用する方法

ローカリゼーションプラットフォームのような現代の翻訳技術は、企業が多言語コンテンツを管理、翻訳、納品する方法を革新することで、効率的なグローバル展開の推進力となっています。これらのツールは、プロセス全体をスムーズにします。

これらのソリューションのほとんどは、機械翻訳エンジンを統合しており、ユーザーは既に使用しているインターフェース内で、大量のテキストを迅速にターゲット言語に変換できます。生産性の向上だけでも大きな効果があり、さらにMTを活用することによるコスト削減と組み合わせることで、得られるROIは驚異的です。

対照的に、MTをコンテンツと同じシステムに存在しないスタンドアロンエンジンとして使用すると、翻訳プロセスに余分な複雑さを加えることになります—ファイルを手動でアップロードしたり、結果をダウンロードしたりする手間を考えてみてください。その結果、ボトルネックや断片的なワークフロー、プロセス全体の可視性の欠如が、翻訳の納品時間と精度に必然的に影響を与えます。

Phrase TMSのような企業翻訳管理システムにおける完全管理されたMTエンジンとしてのDeepLのケースを考えてみましょう。システムは、各ジョブに最適な機械翻訳エンジンを自動的に使用し、そのAIベースのソリューションが翻訳する必要のないコンテンツを除外します。

  • 技術的なセットアップについて心配する必要はありません:スイッチを「オン」に切り替えるだけで、あなたの言語に対してエンジンが自動的に有効になり、その力をすぐに活用できるようになります。
  • 最適なコンテンツにのみDeepLを使用してください:DeepLは非常に強力なエンジンですが、すべてのドメインや言語ペアが同じように恩恵を受けるわけではありません。Phraseの自動選択機能を使用すると、複数のMTエンジンを一度に有効にし、それらを自動的に能力に最も適したコンテンツに割り当てることができます。
  • 用語集を活用する:すべての機械翻訳用語集と用語をTMS内で直接管理でき、DeepLはそれらを使用してすべての翻訳が会社のスタイルに沿ったものになるようにします。これは他の統合されたMTエンジンにも適用されます。
  • エンジン間でのポストエディット向け無制限MTをご利用いただけます:DeepLはスタンドアロンソリューションとして無制限のMTを提供しますが、Phrase TMSを使用すれば、すべての完全管理されたエンジンに対して同じ利点を享受できます。

DeepLは、あなたの使用方法次第で、その真価を発揮します。

DeepLがその謙虚な始まりから長い道のりを歩んできたことは明らかであり、今日ではさまざまな使用ケースに対して迅速に高品質な翻訳を生成するために使用できます。

しかし、その真の潜在能力をアンロックするためには、適切な種類のコンテンツに対して、使用ケースに応じた異なるレベルのポストエディットを行い、もちろん適切な技術の中で使用する必要があります。Phrase TMSのような翻訳管理システムは、この目的に最適なコンテキストであり、DeepLを際立たせるすべての機能にアクセスすることを可能にします。

Unlock the power of machine translation

Discover advanced machine translation management features within our enterprise-ready TMS and create new business opportunities worldwide more quickly and efficiently.

関連投稿

MT-AI-MTPE

Blog post

ポストエディットとは? それが必要な理由とメリット、注意点、具体的な手順を解説

「ポストエディット」という言葉を聞いたことのある方は、どれくらいいらっしゃるでしょうか? すでに翻訳業務に関わっている方はご存知かと思いますが、それ以外の業界の方はまだ馴染みがないかもしれません。歴史的にはごく最近に登場したポストエディットについて、それが必要な理由やメリット、注意点、具体的な手順などを見ていきます。

Illustration of AI technology symbolized by a glowing circuit board pattern surrounding the letters 'AI' in a high-tech server room, representing the integration of artificial intelligence in global communication and translation processes.

Blog post

ChatGPT翻訳:AIを活用したグローバル成長

ChatGPTがどのようにグローバル企業で 翻訳に活用されているかを知り、その機能、メリット、限界、そして多言語コミュニケーションを強化し、翻訳ワークフローを効率化するためのAIソリューションの統合に関するベストプラクティスを学びます。 また、Reddit、Khan Academy、Indeedといった企業が、どのようにしてより効率的で高品質な翻訳を実現しているかについてもご紹介します。

Artificial intelligence blog post featured image | Phrase

Blog post

人工知能の活用:人工知能とは何なのか、なぜ重要なのか、そしてどのように機能するのか

AIはグローバルビジネスにとってゲームチェンジャーであり、これからも確実に存在し続けます。本ブログでは、AIが意味することや、活用するメリット、そしてAIがもたらす可能性について探ります。

Blog post

機械翻訳とは?種類・活用シーン・ベストプラクティスを解説

グローバル展開を加速するため、機械翻訳を活用する企業が増えています。この記事では、機械翻訳の基本から活用法、導入時のポイントまでをわかりやすくご紹介します。

Machine translation category visual | Phrase

Blog post

Google翻訳の精度は向上している? DeepLなど他エンジンとの比較、最大限に活用する方法

おそらく世界で最も有名な機械翻訳エンジン「Google翻訳」について、仕組みや特徴、最大限に活用するためのポイントを解説します。