人工知能および機械学習に関する声明
本ページの日本語版は参考情報として提供されているものであり、「人工知能および機械学習に関する声明」の正式な内容は英語版をご確認ください。
Phraseでは、人工知能(AI)が私たちのサービスにおいて重要な役割を果たしています。最先端のAIテクノロジーを活用するという取り組みにより、お客様のニーズに合わせた革新的で効率的、かつパーソナライズされたソリューションを確実に提供できます。AIをサービスに統合することで、急速に進化するデジタルの世界でお客様が常に一歩先を行くことができるよう、価値の向上、エクスペリエンスの改善、変革的な結果をお客様に提供しています。
この人工知能と機械学習に関する声明(「声明」)は、透明性、セキュリティ、倫理的なAI実践に重点を置き、AI対応のソリューションとコンテンツを責任を持って使用してAIモデルに学習させるというPhraseの取り組みについて概説しています。私たちの使命は、シームレスで洞察力に富み、満足できるテクノロジーソリューションを提供することで、お客様のエクスペリエンスを向上させることです。
Phraseは、信頼がお客様との関係の基盤であることを認識しており、お客様のコンテンツがどのように使用されるかについてお客様に十分な情報を提供することに尽力しています。Phraseのアプローチは、倫理的な慣行、強力なデータセキュリティ、適用される規制への遵守を重視しており、AI対応ソリューションが強力で効率的であるだけでなく、カスタマーコンテンツのプライバシーと機密性を尊重することを確約します。
この声明は、欧州連合人工知能法(AI法)に定められた透明性義務に対するPhraseの遵守を保証することを目的としています。AI法は2026年8月2日をもって完全に施行されますが、PhraseはAIシステムを安全かつ倫理的に作成、使用し、AI法およびその他の適用される法的規制に準拠するように取り組んでいます。
1.定義
「AI法」とは、人工知能に関する統一規則を定める、規則(EC) No 300/2008、(EU) No 167/2013、(EU) No 168/2013、(EU) 2018/858、(EU) 2018/1139、(EU) 2019/2144、指令2014/90/EU、(EU) 2016/797、(EU) 2020/1828(人工知能法)を改正する、2024年6月13日の欧州議会および理事会の規則(EU) 2024/1689を意味します。
AI法によれば、「AIシステム」とは、さまざまなレベルの自律性で動作するように設計されており、展開後に適応性を発揮する可能性があり、明示的または暗黙的な目的のために、受信した入力から、物理環境または仮想環境に影響を与える可能性のある予測、コンテンツ、推奨事項、決定などの出力を生成する方法を推論する機械ベースのシステムを意味します。
「カスタマーコンテンツ」とは、Phraseのお客様やそのユーザーがPhraseソリューションにアップロードしたり、Phraseソリューション内で作成、翻訳(翻訳コンテンツを含む)したりするすべてのコンテンツを意味します。
「GDPR」とは、個人データの処理に関する自然人の保護およびそのようなデータの自由な移動に関する2016年4月27日の欧州議会および理事会の規則(EU) 2016/679、ならびに指令95/46/EC(一般データ保護規則)の廃止を意味します。
「QPS」とは、品質評価スコアを意味します。
「LQA」とは、言語品質評価を意味します。
「MQM」とは、多次元品質指標を意味します。
「MT」とは、機械翻訳を意味します。
「OpenAI」とはOpenAI, LLCを意味します。
2.はじめに
Phrase Localization Platformは、AI法の意味におけるAIシステムであり、Phraseは、そのプロバイダとして、Phrase Localization PlatformのAI法への準拠に責任を負います。
Phrase Localization Platform内で使用されるAI対応ソリューションは、ユーザーの操作、社会的スコアリングの実行、ユーザーの脆弱性の悪用など、AI法で禁止されている行為には関与していません。さらに、Phrase Localization Platform内で使用されるAI対応ソリューションは、PhraseのAI対応ソリューションが重要なインフラストラクチャ管理、生体認証、またはAI法に従って特別な監視を必要とするその他の重要なアプリケーションなどの活動に使用されていないため、AI法の下では高リスクAIシステムとして分類されることはありません。
AI主導のソリューションが標準になるはるか前から、長年、カスタマーコンテンツは翻訳モデルの改善に不可欠でした。これまで、統計的およびルールベースの機械翻訳モデルを含む翻訳エンジンは、翻訳の正確性、流暢さ、全体的な品質を向上させるために、顧客の翻訳メモリ(TM)と言語資産に依存してきました。この長年にわたる慣行は、翻訳技術の開発と継続的な改良の基礎となっています。
3.PhraseのAI対応ソリューション
以下では、Phrase Localization Platformの不可欠な部分を形成する個々のAI機能の詳細な概要を示します。私たちの透明性への取り組みに沿って、これらの機能の仕組み、AIモデルの学習に含まれるプロセス、およびこれらのプロセスでカスタマーコンテンツがどのように利用されるかについて、明確で包括的な情報を提供することを目指しています。
3.1 顧客は人工知能または機械学習を使用するサービスまたはテクノロジーソリューションのためにPhraseを使っていますか?
Phraseは、すべてのプロジェクトに適用するか、特定のプロジェクトに選択的に適用するかにかかわらず、お客様がアクティベーションを完全に制御できるAI対応ソリューションを提供しています。
私たちの専任のAIリサーチチームは、開発チームと連携して、AIおよび機械学習(ML)機能の継続的な改善に取り組んでいます。以下に概説する主要なソリューションは、現在利用可能な機能または積極的に開発中の機能を表しています。
私たちは、お客様独自のユースケースをより深く理解し、懸念事項に対処するために、さらなる議論を歓迎します。お客様からのフィードバックは、ソリューションを改良し、将来の開発努力を導く上で非常に重要です。
3.2 AI/MLソリューションの目的は何で、顧客はAI/MLソリューションをどのように使用しますか?(例:AI/MLソリューションでどのような決定やアクションが促進されますか?)
以下のセクションでは、Phraseの個々のAI対応ソリューションを一覧化しています。一般的に、私たちの目標は、大規模なコンテンツのグローバル化を促進するためにローカリゼーションプロセスを最適化するソリューションを提供することです。Phraseは、商業的な最適化を推進できる完全自動化ソリューションと部分自動化ソリューションの両方を提供するだけでなく、プラットフォームの使いやすさと人間によるエクスペリエンスを向上させるツールも提供することを目指しています。これには、自動翻訳のほか、品質の最も低いコンテンツを識別して人間によるレビューに送るのに役立つPhrase QPSなどのメカニズムが含まれます。
以下は、PhraseのAI対応機能の概要表です。より詳細な説明は以下に記載されています。
(a) テキスト生成AI:以下の表は、テキストコンテンツまたは翻訳を出力または生成するAI機能の詳細を示しています。
機能名 | 機能の概要 | カスタマーコンテンツを学習させるか? |
Auto Adapt | 自動化されたポストエディットとテキストの適応 | いいえ |
AI Actions | Stringsエディタプラットフォームの自動編集操作のサブセット | いいえ |
Phrase NextMT | 機械翻訳、PhraseのMTエンジンを介したコンテンツの自動翻訳 | いいえ |
Phrase Next GenMT | 機械翻訳、OpenAIとの相互作用を介したPhrase独自のモデルによるコンテンツの自動翻訳 | いいえ |
Phrase CustomAI (Custom NextMT) | 顧客特有のパーソナライズされたMTエンジンの学習と評価 | はい |
Phrase CustomAI(言語アセットキュレーション) | 自動ツールを使用して、カスタムMT学習のための言語アセットとデータセットをキュレーション | はい(QPSを使用) |
(b) 他のAI機能:以下の表は、顧客コンテンツやテキストを生成しないAI機能の詳細を示しています。
機能名 | 機能の概要 | カスタマーコンテンツを学習させるか? |
MT自動選択機能 | ジョブに最も適切なMTエンジンを自動的に選択 | はい |
Phrase QPS | 翻訳されたコンテンツの正確性を自動的にスコアリング(0~100) | はい |
自動LQA | LQA(言語品質評価)の完全または部分的な自動化を提供、翻訳品質を評価 | はい |
翻訳不要箇所 | 翻訳不要箇所の自動検出 | はい |
リンギストの自動選択 | 以前の類似ジョブに基づく自動的なリンギストの推奨 | はい |
A. Phrase Language AI、MT自動選択機能
PhraseのMT自動選択機能は、特定のジョブに最も適したMTエンジンを選択するAIベースのメカニズムです。出力翻訳の品質を最大限に高め、その後のポストエディットのコストを最小限に抑えるために、お客様は、定義済みの優先エンジンリストの有無にかかわらずこの機能を使用できます。
この機能の目的は何ですか?カスタマーコンテンツにおいて1つのエンジンが他のエンジンよりも高品質の出力を生成する場合、お客様がさまざまなMTエンジンにアクセスし、それらを動的に切り替えることです。
例:お客様はMTプロファイルに3つのMTエンジンを割り当てており、最高品質の出力を提供するエンジンを確実に使用したいと考えています。システムはお客様のコンテンツを確認し、3つのMTエンジンの最近のポストエディットデータをレビューして、その3つのエンジンのうちの1つを翻訳に最適な候補として推奨します。
仕組みはどのようになっていますか?カスタマーコンテンツをスキャンして、AIがコンテンツのドメインを識別するのに役立つキーワードを探します。また、さまざまなMTエンジン間でそのドメインの最近の顧客出力の品質を評価します。次に、システムはデータに基づいてどのMTエンジンが最高の品質を達成するかを決定します。
カスタマーコンテンツはどのように使用されますか?AIはドメインを識別するためにカスタマーコンテンツを簡単にスキャンし、定期的に他のカスタマーコンテンツも確認して、行われたポストエディットの量を評価します。これは、各MTエンジンのパフォーマンスを確立するのに役立ちます。
カスタマーコンテンツはどのように保護されますか?このプロセス中、カスタマーコンテンツが保持または共有されることはありません。
B. QPS、品質評価スコア
Phrase QPSは、LQAプロセスで特定のコンテンツに与えられる可能性のある MQM スコアを予測する品質推定システムです。0~100のスコアを出力し、大規模な品質の透明性を提供することで、お客様がリソース、ポストエディットの作業負荷、その他のプロセスを計画するのに役立ちます。
この機能の目的は何ですか?翻訳品質に関する幅広い洞察を得るためのスケーラブルなソリューションを提供することを目指しています。これは、機械翻訳が優先され、品質が保証されていないシナリオで特に重要です。具体的には、お客様は自動化されたワークフローでこの機能を使用して、コンテンツを送る場所を決定し、最も品質の低いコンテンツがキャプチャされ、ポストエディットまたはその他の適切なワークフローステップに送信されるようにします。
例:あるお客様はポストエディットの予算が限られており、コンテンツの大部分を機械翻訳に頼っています。Phrase QPSを使用すると、スコアが最も低いコンテンツを自動的に識別し、人間によるポストエディットに送ることができます。
仕組みはどのようになっていますか?Phrase QPSの背後にあるAIは、公開されているデータセットとカスタマーコンテンツの両方を学習させた社内の独自モデルです。具体的には、Phrase Platformで生成された以前のLQA評価の例と、Phrase Platformで生成されたMTポストエディットの例を使用して学習させます。このコンテンツには、元のコンテンツ、結果として得られた翻訳、およびその翻訳のLQA評価が含まれます。AIに複数の翻訳例とその翻訳から得られたMQMスコアを示し、新しいコンテンツのMQMスコアを予測するように学習させます。学習したAIを実際に使用する場合は、原文と訳文の両方を提供し、システムは0~100のスコアを出力します。
カスタマーコンテンツはどのように使用されますか?カスタマーコンテンツを使用してAIに学習させ、定期的に再学習させることで、翻訳が人間によるLQAで評価された場合に得られるであろうスコアを反映した推定多次元品質指標(MQM)スコアを生成できるようにしています。カスタマーコンテンツはモデルに渡され、そのコンテンツのスコアが生成されます。
カスタマーコンテンツはどのように保護されますか?カスタマーコンテンツでモデルに学習させますが、その唯一の機能は0~100のスコアを出力することです。誰もモデルからカスタマーコンテンツを取得することはできません。QPSの学習に使用されるカスタマーコンテンツも保持されません。GDPRとプライバシー通知およびデータ保持ポリシーの両方に準拠するために、Phrase AIリサーチチームは学習データを定期的に削除しています。
C. 自動LQA
自動LQAを使用すると、自動化された言語品質評価を通じて、品質の問題をより深く理解できます。これは、人間によるレビューとは独立して使用することも、検証モードを通して人間によるLQAと連携して使用することもできます。システムは、人間によるプロセスと同様に、MQMに沿ったLQA出力を提供します。
この機能の目的は何ですか?QPSがMQMの推定値として品質スコアを提供するのに対し、自動LQAは翻訳品質の問題に関するより詳細な情報を提供することを目的としています。品質の問題を特定し、それらのエラーにエラーカテゴリと重度を割り当てるという点で、人間によるLQAプロセスを再現するように設計されています。また、検出されたエラーの最小限の説明も提供します。これは、人間によるLQAを補完する、より広範な品質フィードバックを提供する手段として、または自動注釈が人間のリンギストに確認とレビューのために提示される「検証モード」で使用できます。このように、この機能は人間のリンギストのQoLを向上させ、LQAプロセスを最適化および拡張することを目的としています。
例:品質の問題があるコンテンツのサブセットがQPSによって特定された場合、お客様は自動LQAを使用してLQA注釈を大規模に事前入力し、検出されたエラーを確認または修正できる人間のリンギストによるレビューを行うことができます。お客様は、見つかった品質の問題に関するレポートを確認し、影響を受けた翻訳を修正するための措置を講じることができます。
仕組みはどのようになっていますか?システムは現在、OpenAIのChatGPTを使用して翻訳されたコンテンツを評価しています。最新の製品モデルは、カスタマーコンテンツを使用するタスク用に特別にファインチューニングされたChatGPTのインスタンスです。
カスタマーコンテンツはどのように使用されますか?翻訳用のカスタマーコンテンツと機械翻訳エンジンからの翻訳された出力は、OpenAIを介して自動LQAに渡されます。システムの出力は、エラーのカテゴリと重度、およびシステムからの説明コメントで構成されるMQMに沿った評価です。
さらに、以前の人間によるLQA評価から得られたカスタマーコンテンツ(カスタマーコンテンツの原文と翻訳された出力を含む)を使用して、ChatGPTインスタンスを評価タスク専用にファインチューニングし、出力の正確性と有用性を向上させることを目指しています。
カスタマーコンテンツはどのように保護されますか?Phraseは、OpenAIとエンタープライズレベルの契約を結んでおり、カスタマーコンテンツがOpenAIに保存されたり、OpenAI独自のモデルや製品の学習に使用されたりしないようにしています。自動LQAの背後にあるChatGPTインスタンスのファインチューニングに使用されるカスタマーコンテンツはPhraseによって保持されません。QPSの学習で使用されるコンテンツの取り扱いと同様に、AIリサーチチームは学習データを定期的に削除しています。
D. Auto Adapt
Auto Adaptは、用語、フォーマリティレベル、語調の一貫性などを確保するためにテキストを調整できる、自動化されたポストエディットおよびコンテンツ適応ソリューションです。お客様は、スタイルなどのテキストのカスタマイズされた適応を行うために追加の指示を提供できます。
この機能の目的は何ですか?Auto Adaptは、スタイルとフォーマリティにおける一貫性と、お客様が指定したスタイルへの調整をより確実にする、ポストエディットの自動化された代替手段を提供することを目的としています。
例:お客様がセグメントレベルのニューラルMTシステムを使用してコンテンツを翻訳しました。その結果、スタイルと語調にいくつかの矛盾があり、言語エラーもいくつかあります。お客様は、矛盾を自動的に解消し、テキストの全体的な品質を向上させるために、コンテンツをAutoAdaptに通します。
仕組みはどのようになっていますか?システムは現在、内部モデルの調整とお客様が提供する構成を利用して、複数のOpenAIモデルを活用して翻訳されたコンテンツを改良しています。
カスタマーコンテンツはどのように使用されますか?カスタマーコンテンツ(単一言語テキスト、または翻訳用テキストと翻訳出力の両方)は、OpenAIを介してAuto Adaptに渡されます。システムの出力は、元のテキストの修正版です。Auto Adaptは、ファインチューニングされておらず、カスタマーコンテンツで学習していません。
カスタマーコンテンツはどのように保護されますか?Phraseは、OpenAIとエンタープライズレベルの契約を結んでおり、カスタマーコンテンツがOpenAIに保存されたり、OpenAI独自のモデルや製品の学習に使用されたりしないようにしています。
E. AI Actions
AI Actionsは、Phrase Stingsエディタ内の一連の機能であり、テキストを自動的に調整して洗練したり、出力のトーンを調整したりすることができます。
この機能の目的は何ですか?AI Actionsを使用すると、Phrase Platformで作業するレビュワーは、翻訳された出力を自動的に洗練したり、出力のトーンを調整したりできます。具体的には、この機能により、レビュワーはテキストを自動的に言い換えたり、文法を改善したり、ビジネス、学術、カジュアル、または技術的なスタイルを反映するようにテキストを短縮または調整したりできます。
例:レビュワーは、文字制限のあるUI要素の翻訳に取り組んでいます。レビュワーは、長さ短縮アクションを使用して、出力の長さを短縮して適合させることができます。
仕組みはどのようになっていますか?システムは現在、OpenAIのChatGPTモデルを使用して、要求された方法でテキストを変更および調整しています。各アクションの背後には、適切な出力を生成するための指示とともにOpenAIに送信されるプロンプトがあります。これらのプロンプトはPhraseの内部にあり、お客様や第三者はアクセスできません(OpenAIを除く)。
カスタマーコンテンツはどのように使用されますか?AI ActionsはChatGPTモデルへの内部プロンプトのみに依存しており、機能の使用を通じてOpenAIに送信されるテキストデータ以外には、ChatGPTモデルのファインチューニングにカスタマーコンテンツは使用されません。
カスタマーコンテンツはどのように保護されますか?Phraseは、OpenAIとエンタープライズレベルの契約を結んでおり、カスタマーコンテンツがOpenAIに保存されたり、OpenAI独自のモデルや製品の学習に使用されたりしないようにしています。
F. 翻訳不要箇所の特定
会社名や製品名など、翻訳すべきでない項目を含むセグメントを識別するAIシステムです。
この機能の目的は何ですか?この機能は、翻訳が不要でスキップできるテキストを識別することで、翻訳ワークフローを最適化することを目的としています。これによりお客様は、特に機械翻訳されたコンテンツの修正を行うポストエディットを回避できます。
仕組みはどのようになっていますか?AIにカスタマーコンテンツで学習させるとともに、翻訳不要箇所のテキスト項目を認識するように学習させ、セグメント全体が翻訳不要箇所かどうかの可能性(0~1の数値で表示)を出力します。
例:お客様は製品名が出てくるコンテンツをお持ちで、これを機械翻訳したくないと考えています。製品名が不必要に翻訳され、これを元に戻すためのポストエディットのコストが発生する可能性があるためです。このAI機能を使用して、翻訳不要箇所である項目をキャプチャし、機械翻訳からブロックします。
カスタマーコンテンツはどのように使用されますか?カスタマーコンテンツは、AI機能の学習と定期的な再学習に使用されます。AIはカスタマーコンテンツをレビューし、コンテンツに翻訳不要箇所が含まれている可能性を表す数値を出力します。この数値は、コンテンツにフラグを付けるために使用できます。カスタマーコンテンツはAIによって保持されることはなく、モデルはバイナリラベル以外のものを出力することはできません。
カスタマーコンテンツはどのように保護されますか?カスタマーコンテンツはこのAIモデルの学習に使用されますが、システムはそのコンテンツを保持または出力できません。モデルからカスタマーコンテンツを取得することはできません。QPSの学習で使用されるコンテンツの取り扱いと同様に、Phrase AIリサーチチームは学習データを定期的に削除しています。
G. Phrase NextMT、Phraseの社内翻訳エンジン
Phrase NextMTは機械翻訳エンジンで、さまざまな言語でコンテンツを自動的に翻訳するのに使用できます。他のサードパーティ製MTエンジンと性質が似ていますが、翻訳時にカスタマーコンテンツを使用して出力の品質を最適化する点が異なります。NextMTはPhrase社内で構築および保守されています。
この機能の目的は何ですか?お客様は、プロの翻訳者によりポストエディットに最適化された機械翻訳コンテンツをリンギストに提供することで、ローカリゼーションプロジェクトの品質と速度を向上させることができます。また、Phrase NextMTを使用して、大量のコンテンツを高速で自動翻訳することも可能です。
例:お客様は限られた予算で大量のコンテンツを翻訳する必要があります。この場合、Phrase NextMTを使用してそのコンテンツ全体を翻訳し、ポストエディットのために人間に送ることができます。
仕組みはどのようになっていますか?Phrase NextMTエンジンは、タグ配置、高度な用語集統合(形態素の語形変化を含む)、翻訳メモリの適応(あいまい一致)のサポートなど、プロの翻訳に合わせて調整されています。Phrase NextMTエンジンの学習では、さまざまな言語の公開データが使用されます。その後、お客様の翻訳メモリを使用して翻訳を改善します。たとえば、お客様のコンテンツスタイルやブランディングに合わせるなどです。
カスタマーコンテンツはどのように使用されますか?Phrase NextMTの学習には、公開され適切にライセンスされたデータセットと、限られた数の商用で取得した独自のデータセットが使用されます。このAIモデルの学習または再学習では、カスタマーコンテンツ、コンテンツ、または翻訳は使用されません。
ただし、お客様は翻訳プロセス中に翻訳メモリやその他の言語アセットを活用して、出力の品質を向上させることができます。このコンテンツはいかなる形でも保持されず、AIモデルの学習にも使用されません。
カスタマーコンテンツはどのように保護されますか?学習でカスタマーコンテンツを除外すること以外に、翻訳プロセスで使用されるお客様のアセット(翻訳メモリ、用語集など)には、個々のお客様のみがアクセスできます。AIモデルによってカスタマーコンテンツが保持されることはなく、他のお客様がアクセスすることもできません。
H. Phrase Next GenMT、PhraseのLLMベースの翻訳エンジン
Phrase Next GenMTは、LLMベースの、Phrase NextMTのより高品質な代替品です。OpenAIのChatGPTモデルをベースとし、これを活用して高品質で流暢な出力を提供します。
この機能の目的は何ですか?Phrase Next GenMTは、Phraseが開発した最高のパフォーマンスを誇るMTエンジンで、その目的は可能な限り最高の品質で自動翻訳を提供することです。Phrase NextMTと同様に、お客様が翻訳メモリやその他のアセットを活用して、出力翻訳の品質を最適化できるようにしています。これは、スタンドアロンの翻訳ソリューションとして使用することも、人間によるポストエディットと組み合わせて使用して高品質の結果を得ることもできます。
例:あるお客様は限られた予算で大量のコンテンツを翻訳する必要があります。Phrase Next GenMTを使用して最初の翻訳を作成し、その後、人間によるポストエディットに送ります。お客様は、翻訳メモリへのアクセスを提供することで品質と文体の調整を高め、翻訳品質をさらに向上させることができます。
仕組みはどのようになっていますか?Phrase Next GenMTは、Phrase内部で開発されたプロンプトを通じてOpenAIのChatGPTモデルと対話します。また、オプションで、お客様の翻訳メモリから取得した類似翻訳の例をFew-shotプロンプトでChatGPTに提供します。
カスタマーコンテンツはどのように使用されますか?現在、高品質の翻訳を実現するために、プロンプトとFew-shotプロンプトの例の取得の組み合わせのみに依存しています。それ以外では、Next GenMTの学習やファインチューニングにカスタマーコンテンツを使用することはありません。翻訳用のコンテンツと翻訳メモリの該当する例がOpenAIに送信され、翻訳が返されます。
カスタマーコンテンツはどのように保護されますか?Next GenMTの学習やファインチューニングにカスタマーコンテンツを使用することはありません。お客様がこの機能の使用をリクエストすると、翻訳を生成するためにコンテンツと例をOpenAIに送信します。OpenAIとのエンタープライズレベルの契約では、OpenAIがモデルや製品の学習や開発でカスタマーコンテンツを保持または使用することはありません。
詳細:Phrase NextMTエンジンは、タグ配置、高度な用語集統合(形態素の語形変化を含む)、翻訳メモリの適応(あいまい一致)のサポートなど、プロの翻訳に合わせて調整されています。社内の機械翻訳エンジンであるPhrase NextMTの現在のバージョンは、公開されているデータを使用して学習を行います。次に、お客様の翻訳メモリを使用して、スタイル一致の改善など、翻訳を改善します。Phrase NextMTの今後のリリースでは、カスタムエンジンを生成する機能をお客様に提供する予定です。お客様は、他のお客様がアクセスできない、カスタム学習した「お客様専用のPhrase NextMTエンジン」を利用できるようになります。
データ使用:現在の汎用Phrase NextMT翻訳エンジンの学習では、公開されているデータのみが使用されます。翻訳プロセス中、学習済みのPhrase NextMT翻訳エンジンは、翻訳されたコンテンツ、お客様の翻訳メモリ(関連するあいまい一致用)、およびお客様のMT用語集にアクセスできます。
データ保護:お客様のコンテンツおよびカスタム学習済みエンジンに、第三者がアクセスすることはできません。
I. Phrase Custom AI、データセット作成、カスタムエンジン学習
お客様は、翻訳メモリからカスタム学習データを作成し、特定のユースケース向けにカスタムPhrase NextMTエンジンを生成することができます。お客様は、他のお客様がアクセスできない、カスタム学習した「お客様専用のPhrase NextMTエンジン」を活用できます。
この機能の目的は何ですか?特定のユースケース向けにパーソナライズされたMTエンジンに学習させることが、お客様にとって有益となる場合があります。Phraseは、お客様が独自のコンテンツからデータセットを作成し、お客様独自のPhrase NextMTインスタンスを学習させるためのツールを提供しています。また、モデル学習の成功と生成されたエンジンの有用性を示す分析機能も提供しています。
例:翻訳メモリを保有するお客様には、汎用MTでは満足のいく品質が得られない特定のユースケースがあります。お客様はCustomAIを使用して、翻訳メモリをクリーニングおよびフィルタリングし、そのコンテンツからデータセットを作成し、お客様の要件に特化した独自のPhrase NextMTインスタンスに自動的に学習させることができます。
カスタマーコンテンツはどのように使用されますか?データセットの作成とクリーニングプロセス、そしてその後のPhrase NextMTエンジンの学習中に、システムはお客様の翻訳メモリにアクセスします。学習が完了すると、生成されたエンジンとデータセットへのアクセスは制限され、該当するお客様のみがアクセスおよび使用できるようになります。これらのカスタムMTエンジンの学習では、他のカスタマーコンテンツは使用されません。
カスタマーコンテンツはどのように保護されますか?カスタマーコンテンツとカスタム学習したエンジンには、そのお客様のみがアクセスできます。カスタムNextMTエンジンの学習では、他のカスタマーコンテンツは使用されません。
J. Phrase CustomAI、言語アセットのキュレーション
Custom AIの自動化ツールは、お客様の翻訳メモリやその他のアセットをフィルタリングおよびクリーンアップするために使用できます。
この機能の目的は何ですか?言語アセットキュレーションツールは、お客様が言語アセットをフィルタリングおよび最適化し、カスタムNextMTモデルの学習など、ローカリゼーションプロセスの他の領域で使用できるようにすることを目的としています。また、Phrase Next GenMTの出力品質を向上させるためのFew-shotプロンプトの例として使用することもできます。
例:あるお客様は大規模な翻訳メモリを生成し、既に翻訳済みの類似コンテンツの翻訳ステップをスキップしたり、Phrase Next GenMTの出力品質を最適化したりするなど、翻訳ワークフローの効率性を高めるために、メモリをクリーンアップしたいと考えています。このキュレーションツールを使用して、重複や低品質の翻訳を削除し、洗練された翻訳メモリを作成します。
仕組みはどのようになっていますか?Phraseのアセットキュレーションツールは、基本的なルールベース(AI非使用)フィルター、Phrase QPS(Phrase QPSの詳細は上記参照)、およびその他のツールを組み合わせて使用しています。ここでのPhrase QPSは、例えば翻訳メモリ内のすべての項目にスコアを付け、スコアが最も低い項目(たとえば下位10%)を除外するために使用されます。
カスタマーコンテンツはどのように使用されますか?上記で説明したPhrase QPS以外に、アセットキュレーションツールではAI機能は使用していません。カスタマーコンテンツはお客様ごとに分離されており、ツールはカスタマーコンテンツを保持または共有しません。フィルタリングの結果もまた分離されており、お客様のみがアクセスできます。
カスタマーコンテンツはどのように保護されますか?アセットキュレーションおよび関連するAIベースのフィルタリングの結果には、お客様のみがアクセスできます。
K. リンギストの自動選択
Phraseのリンギストの自動選択機能は、類似ドキュメントの翻訳経験を持つリンギストを推薦することで、お客様のプロジェクト割り当て決定の一部を自動化します。
この機能の目的は何ですか?このAIベースの機能により、リンギストの割り当てを最適化し、プロジェクト管理における反復的な意思決定を削減することで、ローカリゼーションプロジェクトの品質とスピードを向上させることができます。
例:あるお客様は、専門分野のコンテンツを翻訳する新規プロジェクトを抱えているとします。AIは入力コンテンツをレビューし、ドメインを自動的に識別します。この機能は類似プロジェクトをレビューし、類似分野のプロジェクトで最も経験豊富なリンギストへの割り当てを推奨します。
仕組みはどのようになっていますか?AIはドキュメントをコンテンツタイプ別に分類するように学習しており、新しいコンテンツを入力すると、その新しいプロジェクトが属するコンテンツの大まかなカテゴリを認識します。このようにして、この機能は類似コンテンツを過去に翻訳したリンギストのリストを取得し、割り当てを推奨します。
カスタマーコンテンツはどのように使用されますか?カスタマーコンテンツは、このAIが入力コンテンツのドメインを分類できるようにする学習に使用されます。システムは新しいコンテンツをレビューし、類似ドメインにおける過去の実績に基づいて、推奨されるリンギストのリストを作成します。
カスタマーコンテンツはどのように保護されますか?カスタマーコンテンツはAIモデルの学習に使用されますが、モデルはカスタマーコンテンツを生成することはできません。モデルからカスタマーコンテンツを取得することはできません。Phrase QPSの学習で使用されるコンテンツの取り扱いと同様に、Phrase AIリサーチチームは学習データを定期的に削除しています。
3.3 Phraseはお客様専用のAI/MLモデルをカスタム開発しますか、それとも汎用AI/MLモデルを提供しますか?
Phraseは両方を提供しています。お客様は、30種類以上の汎用エンジンと追加のカスタムMTモデルのいずれもご利用いただけます。カスタムMTモデルは、カスタマーコンテンツを使用して、特定のお客様に合わせてカスタマイズされます。詳細についてはは、第3.2条のセクションGをご覧ください。
お客様独自のAPIキーで統合されたMTエンジン
お客様が直接関係している第三者が提供するMTエンジンのカスタムモデル学習(お客様が独自のAPIキーを使用してMTエンジンをPhrase Localization Platformに統合する場合)については、Phraseは管理しかねます。
4. AIガバナンスの一般原則
AIガバナンスとは、AI対応ソリューションの倫理的かつ責任ある開発、展開、管理を導くフレームワーク、ポリシー、およびプラクティスを網羅するものです。Phraseでは、AI対応ソリューションへの信頼は、透明性、説明責任、そしてすべてのステークホルダーの権利と合理的な期待の尊重という基盤の上に築かれると認識しています。
4.1 倫理的考慮とプライバシー
Phraseは、AI対応ソリューションの開発および展開において、個人の権利を尊重し、公平性を促進し、カスタマーコンテンツの機密性を保持するという原則を遵守しています。
Phraseは、AIモデルの学習に必要なデータ量を、AI対応ソリューションの強化とお客様への高品質なサービスの提供という目的を達成するために厳密に必要な範囲にまで最小限に抑えることをお約束します。この点において、Phraseは学習データの保持も厳しく制限しています。Phraseは、可能な限り、AIモデルの学習に匿名化または仮名化されたデータを使用するか、集約されたデータを使用することを検討します。Phraseは、AIモデルの出力が関連性を保ち、学習データに関連する個人データが漏洩しないよう監視します。
PhraseのAIモデルの学習に使用されるカスタマーコンテンツ(上記第3条で詳細に説明)は、個人データが含まれる可能性がある場合、GDPRおよびその他の適用されるデータ保護法に従って処理されます。Phraseにおけるデータ処理の詳細については、プライバシーに関する通知をご覧ください。
4.2 人間による監視と管理
Phraseの専任のAIリサーチチームは、AI対応ソリューションの出力結果に対して定期的な品質保証チェックを実施しています。このプロセス全体は、適用法令の遵守を確保するため、法務チームが監督しています。これらのチェックにより、出力結果が正確性、公平性、そして社内ポリシーと適用法令の両方への準拠という適切な基準を満たしていることが保証されます。
透明性と継続的な改善を支援するため、ユーザーと従業員は潜在的な問題をAIリサーチチームに報告し、さらなる確認を依頼することができます。報告された問題は、体系的なレビュープロセスを経て、チームが根本原因を特定し、欠陥に対処し、システムのパフォーマンスと信頼性を向上させるために必要な調整を実施します。
オープンなフィードバックループを促進することで、すべてのステークホルダーがAI対応ソリューションの信頼性と倫理的な利用に貢献できるようにすることを目指しています。
4.3 AIリテラシー
Phraseでは、AI法に基づき、AIシステムの開発、展開、監督に関わるすべての従業員がAIの概念、リスク、ベストプラクティスを十分に理解できるよう努めています。Phraseの従業員は、AI法の基本的なAI概念と原則、そしてその遵守に関する研修プログラムに参加する義務があります。これにより、私たちのチームはAI対応ソリューションを責任を持って実装および監督するために必要な知識とスキルセットを習得できます。
AI法およびその他の関連規制は今後変更される可能性があり、Phraseは最新の基準を反映するために、研修資料、ポリシー、および文書を更新していくことに尽力しています。
結論
AI法の理解と解釈は今後も進化し続けることを認識し、必要に応じて本声明を改訂する権利を留保します。
本声明に関してご質問やご要望がございましたら、privacy@phrase.comまでお問い合わせください。
最終更新日:2025年2月13日