機械翻訳におけるDeepLの探求:その仕組みと精度

DeepLは、世界をリードする機械翻訳プロバイダーの一つです。その仕組みやメリット・デメリット、そしてパフォーマンスと効率を最大限に引き出すための活用方法を探っていきましょう。

言語の壁を越えて効率的かつ正確なコミュニケーションを可能にするという約束は、機械翻訳(MT)開発の大きな原動力となってきました。1950年代に実験的な試みとして始まった機械翻訳(翻訳はコンピュータ能力の最初期の応用例の一つでした)は、21世紀に入り、実用的な生産性向上ツールへと進化しました。

今日、AI(人工知能)を活用した機械翻訳ツールは、グローバルなビジネス運営に革命をもたらしています。主要な機械翻訳プロバイダーの一つが、ドイツに拠点を置くニューラル機械翻訳(NMT)技術プロバイダーであるDeepLです。このガイドでは、DeepLの仕組みやその長所と短所、そしてプロの翻訳プロジェクトで活用するためのベストプラクティスについて詳しく解説します。

DeepLとは?概要

DeepLは2009年にオンライン辞書サービス「Linguee」としてドイツで設立され、従来の統計的機械翻訳(SMT)よりもはるかに高品質な翻訳を実現するニューラル機械翻訳システムの構築を目指しました。

DeepLのエンジニアたちは、社名の由来でもある最新のディープラーニング技術を応用し、Lingueeのデータベースにある既存データを用いてモデルの学習を行いました。

2017年のサービス開始以来、DeepLは絶大な人気を博しており、現在までに10億人以上の人々がそのサービスを利用しています。現在は28言語をサポートし、650通りの翻訳の組み合わせを提供しています。

ユーザーは、DeepLの無料版と有料版、およびウェブインターフェースとスタンドアロン型の翻訳アプリから選択できます。無料版は個人利用に適しており、有料版はビジネス向けのより多くの機能を提供しています。

DeepLはもはや単なる翻訳サービスではありません。同社は現在、文章生成に焦点を当てた人工知能分野にも進出しています。2023年初頭にリリースされた最新サービス「DeepL Write」は、英語のライティングアシスタントとして、Grammarlyのようなライバルを超えることを目指しています。

DeepLの仕組みは?

すべてのMTが同じように作られているわけではなく、時間の経過とともにシステムはますます洗練されてきました。2016年まで、MTシステムは「ルールベース(手作業で作成された膨大なルールに依存するもの)」か、あるいは「統計的(多言語コーパスと呼ばれる膨大な対訳データに基づき、単語やフレーズ単位で統計的パターンを探して翻訳するもの)」のいずれかでした。

今日、主流の機械翻訳システムのほとんどはニューラルネットワークを使用しています。これはニューラル機械翻訳と呼ばれ、エンドツーエンド学習の一形態です。プログラムのニューラルネットワークが、翻訳対象の語句の前後数語だけでなく、文章を生成する各段階で入力文全体を考慮に入れます。

DeepLはNMTシステムの代表例です。ディープラーニングのアルゴリズムにより、統計的機械翻訳エンジンが生成するものよりも人間が書いたような自然な翻訳を実現しています。そのネットワーク構造により、膨大なデータから学習し、新しい文脈に適応することも可能になっています。

DeepLの機能分析

前述の通り、DeepLの最大の強みはそのNMTシステムにあり、従来の統計的機械翻訳手法と比較して、より正確で自然な響きの翻訳を生成することができます。その主要な機能をいくつか見てみましょう。

  • 多言語対応:DeepLは、英語、スペイン語、フランス語、ドイツ語、中国語、日本語など、幅広い言語間の翻訳をサポートしています。ユーザーは、個別のツールを用意することなく、異なる言語ペア間でシームレスにテキストを翻訳できます。
  • 文脈の把握:DeepLが採用しているAIエンジンは入力テキストの文脈を理解できるため、文脈に即した正確な翻訳を行い、意図された意味を維持することを目指しています。これは、慣用句や複雑な文章を扱う際に非常に有利に働きます。
  • 翻訳品質DeepLは特定の言語ペアにおける翻訳品質の高さで知られており、ユーザーから高く評価されています。文脈を把握し正確な翻訳を提供する能力は、プロの翻訳者から語学愛好家まで幅広く支持されています。
  • 翻訳者プラグインとデスクトップアプリ:DeepLは、Microsoft Officeを含む様々なアプリケーションと連携できるブラウザプラグインを提供しており、使用中のプログラムを離れることなく直接テキストを翻訳できます。また、主要なOSに対応したデスクトップアプリをダウンロードして利用することも可能です。
  • 文書翻訳機能:テキスト翻訳に加え、DeepLでは文書ファイルを丸ごとアップロードして翻訳することができ、多言語コンテンツを扱う個人やビジネスにとって便利な機能となっています。
  • データプライバシードイツに拠点を置くDeepLは、欧州連合(EU)のデータ保護法(GDPR)の適用を受けます。無料版でのデータ取り扱いについては明言を避けていますが、DeepL Proの加入者に対しては、すべての翻訳で暗号化された安全な接続が保証され、翻訳完了後にデータがサーバーに保存されることはないことを明確にしています。
  • API連携DeepLはAPIを提供しており、開発者は自社のアプリケーションやウェブサイト、サービスに翻訳機能を組み込み、エンドユーザーにシームレスな翻訳体験を提供することができます。

DeepLの主要な競合他社は?

機械翻訳ツールの世界は広大で、多種多様な選択肢が存在します。DeepL以外にも、よく知られた機械翻訳プロバイダーとして以下のようなものがあります。:

Google 翻訳

2006年にサービスを開始したGoogle 翻訳は、DeepLが誕生する数ヶ月前の2016年に、統計的モデルからニューラル機械翻訳(NMT)モデルへと切り替えました。

133以上の言語をサポートしており、自社サイト翻訳用のAPI利用や、月間50万文字を超える利用を除けば、基本的には無料で利用できます。非常に使い勝手の良いインターフェースと直感的なデザインにより、一般ユーザーの間で広く普及しています。さらに、ウェブサイト全体や画像、音声の翻訳も可能です。

Systran 翻訳

1968年に設立されたSystranは、市場で最初の商用機械翻訳ソフトウェアでした。また、Systranはニューラル機械翻訳とニューラルシーケンス学習のためのオープンソース・エコシステム「OpenNMT」を持つ唯一の企業でもあります。:OpenNMT

Systran Translateは50以上の言語に対応しており、ユーザーは独自の用語集や辞書、コーパスを追加して出力をカスタマイズすることができます。

Microsoft 翻訳

Bing(Microsoftの検索エンジン)やMicrosoft Office製品の標準機能として組み込まれているMicrosoft 翻訳は、2009年にサービスを開始し、アテンション・ベース・モデルを用いた最新のニューラルネットワーク技術に基づいています。

現在では、iPhoneおよびAndroid端末向けの単体モバイルアプリとしても提供されています。100以上の言語をサポートし、音声とテキストの両方の翻訳が可能です。

Amazon Translate

この分野では比較的新しいプレイヤーであるAmazon Translateは、2017年にリリースされました。ニューラル機械翻訳エンジンを採用しており、登場から短期間で驚異的なパフォーマンス・レベルに達しています。

利用にはAWSアカウントが必要で、用語や対訳データによるカスタマイズ、用語のエンコード、Amazon S3を活用したバッチ翻訳など、多彩な機能にアクセスできます。

Tencent 機械翻訳

Tencent 機械翻訳(TMT)は、市場への最新参入者の一つです。現在は10言語をサポートしており、ニューラル翻訳モデルと統計的翻訳モデルの両方を組み合わせています。

特に中国語に関する能力が際立っており、英中翻訳では過去最高の人間評価スコアを、中英翻訳では最高の自動評価スコアを記録しています。

DeepL 対 Google翻訳:どちらが優れているか?

DeepLはGoogle 翻訳よりも優れているのでしょうか?この問いに対する答えは、他のあらゆる事柄と同様、文脈やユーザーの具体的なニーズによって異なります。一般的に言えば、DeepLはGoogle 翻訳よりも精度の高い機械翻訳エンジンであると見なされることが多いです。

とは言え、いくつか制限もあります。DeepLの対応言語数はGoogleよりも少なく、元の書式を維持した文書丸ごと翻訳や、敬体(フォーマル)と常体(インフォーマル)の使い分けといった全機能を利用するには、有料のアカウントが必要です。

Google 翻訳にはないDeepL独自の機能として、出力ボックス内の翻訳された単語をクリックするだけで、別の翻訳案を素早く表示できる機能があります。DeepLが提案したものとは別の訳語を選択すると、その選択を反映して文章の残りの部分も自動的に更新されます。

セキュリティ面では、無料版の場合、Google 翻訳もDeepLも翻訳したテキストの履歴を保持します。対照的に、DeepL Proは世界最高水準のデータ保護基準を提供しており、翻訳後すぐにテキストが削除されます。そのため、機密性の高いコンテンツの取り扱いに非常に適しています。

全体として、両プロバイダーともに機械翻訳において有用なソリューションを提供しています。カスタマイズの必要がなく、幅広い言語の選択肢を備えた安価で使いやすい翻訳ツールを探しているなら、Google 翻訳の方が良い選択かもしれません。一方で、カスタマイズが可能で精度の高い翻訳を必要とし、さらにデータ保護を確実にしたいのであれば、DeepLの方が適していると言えるでしょう。

DeepLの正確性とパフォーマンスの評価

機械翻訳エンジンの精度をひと口に「何パーセント」と断定するのは、実は非常に難しい問題です。翻訳の質は、対象となる言語の組み合わせはもちろん、専門的な金融文書なのか、あるいは親しみやすいブログ記事なのかといったコンテンツの種類、そしてどこまで自社向けにカスタマイズされているかによって大きく左右されるからです。

そもそも言語は生き物であり、書き手の「真の意図」を数値化することはできません。そのため、正確性という言葉の定義自体が、状況によって変わってくるのです。例えば、一字一句の正確さが求められる小説と、スピード感が重視されるSNSの投稿では、文法や句読点に求められる基準が根本的に異なります。

とはいえ、ネット上の評判やユーザーの声を見ると、DeepLの翻訳精度は総じて極めて高く、特にヨーロッパの言語間の翻訳においては圧倒的な信頼を得ています。DeepL社が自ら行っている検証データも、この評価を裏付けています。がこれを裏付けています。もちろん自社データには多少の自負も含まれるでしょうが、より信頼できる指標は、実際のユーザーから寄せられる高い満足度です。具体的には、主に以下の点で高く評価されています。

  • 慣用句やスラングを汲み取り、自然な言い回しに置き換える表現力
  • 翻訳特有の違和感がない、人間らしい自然な文章構成
  • 敬体(丁寧語)と常体(ため口)の使い分け

結局のところ、各ユーザーは自分のユースケースでDeepLがどの結局のところ、最終的な判断は、皆さんのビジネス現場で実際にDeepLを試した上で下していただくのが一番です。幸い、DeepLには無料版がありますので、コストを気にせずその実力を直接確かめることができます。

Machine transtion report key visual | Phrase

Interactive MT report: Uncover top performers

Find out how leading machine translation engines perform for different content types using the latest data in our quarterly machine translation report.

DeepLのメリットとデメリット

DeepLのようなニューラル機械翻訳は、ビジネスの可能性を大きく広げてくれます。この分野の先駆者であるDeepLを活用することで、以下のようなメリットを享受できます。

  • 精度の高さ:文脈を深く理解し、時間の経過とともに学習を深めることで、より自然で正確な翻訳を実現します。
  • 学習スピード:膨大な手作業が必要だった従来の翻訳手法とは異なり、自動化されたプロセスで迅速にAIを成長させることができます。
  • 柔軟な連携:APIやプラグインを通じて、主要なブラウザやソフトウェア、多様なファイル形式にそのまま組み込めます。
  • カスタマイズ性:自社専用の用語集やブランド独自の表現を反映させることで、出力を最適化することが可能です。
  • コストパフォーマンス:他のAI翻訳と同様、驚くほど低いコストで、かつスピーディに大量の翻訳を処理できます。
  • 拡張性:ビジネスの急成長に伴う翻訳量の増加にも、柔軟かつ容易に対応できます。

もちろん、DeepLがどれほど進化したとしても、機械翻訳が完璧になることは現時点では考えにくいでしょう。人間による翻訳の域に達するには、まだ克服すべき課題が残っています。

今後数年間でDeepLがどこまで人間に迫れるかは、予測が難しいところです。現時点では、以下のような「人間ならでは」のスキルにはまだ及びません。:

  • 不明点を確認する
  • 行間や背景を深く読み解く
  • 原文自体の間違いを指摘する
  • 皮肉やユーモアを正しく理解する
  • 創造的な言い回しを生み出す
  • 背景を考慮して最適な言葉を選ぶ
  • 事実関係をリサーチする
  • 全体の一貫性を厳密に守る
  • 内容の過不足がないか保証する
  • あえて情報を足したり引いたりして調整する
  • 注釈や補足説明を加える

こうした細やかな判断をAIだけで完結させるのは難しいため、近い将来においても、人間が最終確認を行う「ポストエディット」は翻訳業務において欠かせないプロセスであり続けるでしょう。

プロの翻訳におけるDeepL活用のベストプラクティス

DeepLを機械翻訳に活用する際は、品質を妥協することなく最大限のメリットを享受できる「使いどころ」を見極めることが重要です。具体的には、以下のようなケースが挙げられます。

  • 人目に触れる機会の少ないコンテンツ:社内メモ、ウェブサイトのフッター、メール、あるいは感情分析用のSNS投稿など、アクセス数が限定的なもの。
  • 実用性重視の定型的な技術文書:取扱説明書のように、内容が理解できれば目的を果たせるもの。ただし、ユーザー体験(UX)を損なわないよう、可能であれば人間の翻訳者によるポストエディット(後編集)を推奨します。
  • 低リスクのコンテンツ:厳密な正確性や複雑な法規制への準拠が求められないもの。例えば製品レビューなどのユーザー投稿コンテンツ(UGC)は、一般的に消費者が高い品質を期待していないため、適しています。
  • 短命なコンテンツ:チャットやメールによるサポートメッセージ、顧客からの問い合わせなど、その場限りの対応で済むもの。
  • 短納期かつ大量のコンテンツ:即座に公開が必要な数百件の製品説明など、スピードが最優先されるもの。
  • 更新頻度の高いコンテンツ:機能のアップデートや情報の更新など、頻繁に修正が加えられるもの。

これらのケースの多くは、正確さと分かりやすさを担保するために「簡易修正(ライトポストエディット)」が必要ですが、ビジネス上の重要度がそれほど高くないコンテンツであれば、機械翻訳の結果をそのまま利用できる場合もあります。

一方で、より高い正確性が求められるコンテンツについては、より時間をかけた入念なポストエディットが不可欠です。例えば、以下のようなものが該当します。:

  • 製品名:簡潔ながら情報量が多く、固有名詞や多義語が含まれやすいため、語順によっては意味が曖昧になりがちです。
  • 構文が大きく異なる言語間の翻訳:例えば日本語とスペイン語のように、語順の入れ替えが必要な言語ペアでは、機械翻訳が自然な文章を作るのが難しくなります。
  • 顧客体験に影響する、標準的な露出度のコンテンツ:ナレッジベースやFAQ、アラート通知などは、効率的なカスタマーサポートを実現するために最大限の正確さが求められます。
  • SEO用メタ情報:画像の代替テキスト(alt属性)やキャプションなどは目立ちにくいものの、検索順位の向上のためには、ターゲット言語のキーワードを用いた技術的な最適化が必要です。

翻訳技術でDeepLを最大限に活用する方法

ローカリゼーションプラットフォームに代表される現代の翻訳テクノロジーは、企業による多言語コンテンツの管理・翻訳・配信の手法を根本から変え、効率的なグローバル展開を可能にする原動力となっています。これらのツールは、業務プロセスの最初から最後までを一気通貫で効率化します。

こうしたソリューションの多くは機械翻訳エンジンを統合しており、ユーザーはコンテンツの取り込みから翻訳、レビュー、そして元システムへの書き戻しまでを、一つの画面上で完結させながら大量のテキストを迅速に翻訳できます。生産性の向上だけでも目覚ましいものがありますが、そもそも機械翻訳を活用することによるコスト削減効果と合わせれば、その投資対効果(ROI)は驚異的なものになります。

対照的に、コンテンツ管理システムと連携させず、独立したエンジンとして機械翻訳を使うと、かえって業務が複雑になります。ファイルをいちいち手動でアップロードしたり、結果をダウンロードしたりする手間を想像してみてください。その結果生じる作業の停滞やプロセスの断絶、そして全体の進捗が見えない状況は、翻訳の納期や正確性に確実に悪影響を及ぼします。

Phrase TMSのような企業翻訳管理システムで、一元管理されたエンジンとしてDeepLを活用する場合を考えてみましょう。システムが各案件に最適な翻訳エンジンを自動で選択し、AIベースの機能によって「翻訳が不要な箇所」を自動的に除外してくれます。

  • 技術的な設定は不要:スイッチを「オン」にするだけで、対象言語に対してエンジンが有効になり、すぐにその実力を活用し始めることができます。
  • 最適なコンテンツにのみDeepLを適用:DeepLは強力ですが、すべての専門分野や言語ペアで同様の効果が得られるとは限りません。Phraseの自動選択機能を使えば、複数のエンジンを同時に有効化し、それぞれの得意分野に合わせてコンテンツを自動的に割り当てることができます。
  • 用語集の活用:すべての機械翻訳用語集と用語をTMS内で直接管理でき、DeepLはそれらをそれらを参照して、すべての翻訳が会社のスタイルに沿ったものになるようにします。これは他の統合されたMTエンジンにも適用されます。
  • あらゆるエンジンでポストエディット用の無制限MT利用が可能:DeepLは単体でも無制限の機械翻訳を提供していますが、Phrase TMSを通せば、管理下にあるすべてのエンジンで同様のメリットを享受できます。

DeepLの価値は、いかに使いこなすかで決まる

DeepLがその誕生から目覚ましい進歩を遂げたことは明白であり、今日では多様な場面で高品質な翻訳を迅速に生成するために欠かせない存在となっています。

しかし、その真のポテンシャルを引き出すには、適切なコンテンツに適用し、用途に応じたレベルのポストエディットを行い、そして何より適切なテクノロジー環境下で運用する必要があります。hrase TMSのような翻訳管理システムは、そのための理想的な環境であり、DeepLの真価を最大限に引き出すためのあらゆる機能を提供します。

機械翻訳の力をアンロックする

当社のエンタープライズ対応TMS内で高度な機械翻訳管理機能を体験し、世界中で新たなビジネス機会をより迅速かつ効率的に創出します。

関連投稿

MT-AI-MTPE

Blog post

機械翻訳ポストエディット(MTPE):AI時代のベストプラクティス、ワークフロー、ツール

これらの機械翻訳ポストエディットにおけるベストプラクティスを活用し、大量のコンテンツを処理する機械翻訳のスピードと、プロのリンギストのスキルを融合させてください。

Illustration of AI technology symbolized by a glowing circuit board pattern surrounding the letters 'AI' in a high-tech server room, representing the integration of artificial intelligence in global communication and translation processes.

Blog post

ChatGPT翻訳:AIを活用したグローバル成長

ChatGPTがどのようにグローバル企業で 翻訳に活用されているかを知り、その機能、メリット、限界、そして多言語コミュニケーションを強化し、翻訳ワークフローを効率化するためのAIソリューションの統合に関するベストプラクティスを学びます。 また、Reddit、Khan Academy、Indeedといった企業が、どのようにしてより効率的で高品質な翻訳を実現しているかについてもご紹介します。

Artificial intelligence blog post featured image | Phrase

Blog post

人工知能の活用:人工知能とは何なのか、なぜ重要なのか、そしてどのように機能するのか

AIはグローバルビジネスにとってゲームチェンジャーであり、これからも確実に存在し続けます。本ブログでは、AIが意味することや、活用するメリット、そしてAIがもたらす可能性について探ります。

Blog post

機械翻訳とは?種類・活用シーン・ベストプラクティスを解説

グローバル展開を加速するため、機械翻訳を活用する企業が増えています。この記事では、機械翻訳の基本から活用法、導入時のポイントまでをわかりやすくご紹介します。

Machine translation category visual | Phrase

Blog post

Google翻訳の精度は向上している? DeepLなど他エンジンとの比較、最大限に活用する方法

おそらく世界で最も有名な機械翻訳エンジン「Google翻訳」について、仕組みや特徴、最大限に活用するためのポイントを解説します。