Estrategia de localización

Búsqueda de calidad: Explorando la personalización de la traducción automática

La personalización de la traducción automática permite a las empresas alcanzar el éxito mundial con traducciones rápidas y de mayor calidad. Aprenda qué lo hace efectivo y cómo hacerlo suyo.
Machine translation customization blog post featured image | Phrase

Las empresas de todo el mundo se apoyan ahora más que nunca en la traducción automática (MT). En 2021, el tamaño del mercado de la traducción automática superó los 800 millones de dólares y se prevé que crezca a una tasa anual del 30% hasta 2030. Esto se debe, en gran medida, a que la traducción automática se ha vuelto más fiable y la presión que tienen las marcas globales para ofrecer contenido personalizado en varios idiomas con mayor rapidez sigue aumentando, a la vez que se mantienen los costes bajo control.

La traducción automática ofrece cada vez más traducciones rápidas y rentables, pero mantener la calidad de la traducción sigue siendo una cuestión urgente.

Para triunfar en el vertiginoso mercado global actual, las empresas deben localizar el contenido a una escala que se ajuste a su dominio, capte el tono correcto y mantenga la coherencia de la voz de su marca en todos los idiomas y canales de distribución.

Ahí es donde entra en juego la personalización de la traducción automática. Al adaptar y entrenar los motores de traducción automática para ofrecer resultados más óptimos, la personalización de la traducción automática ofrece una ventaja estratégica a las empresas que desean conectarse con audiencias internacionales, impulsar la participación y aumentar las conversiones en todos los mercados.

Siga leyendo para descubrir cómo usted también puede hacer que la personalización de la traducción automática funcione para su empresa.

¿Qué es la personalización MT?

Imagínate esto: En el corazón de una bulliciosa ciudad, un hábil sastre se ha hecho un nombre al confeccionar trajes que personifican la precisión y el arte. Del mismo modo que adapta cada traje a las necesidades únicas del usuario, la personalización de MT perfecciona los motores de traducción para lograr una precisión específica de la industria.

Esta fusión de artesanía y tecnología garantiza que las traducciones se adapten perfectamente a su contexto, de la misma manera que un traje hecho a medida transmite estilo y confianza. Ambos esfuerzos ejemplifican cómo la atención al detalle transforma los elementos ordinarios en resultados excepcionales.

La personalización de la traducción automática es el proceso de crear, implementar y mantener un motor de traducción automática que utiliza datos para generar traducciones de alta calidad en un dominio y un par de idiomas específicos. También conocida como MT personalizada, garantiza que el resultado final se alinee perfectamente con los requisitos únicos de un dominio o industria en particular.

La evolución de la personalización de la traducción automática

Para apreciar realmente el poder de la personalización de la traducción automática, retrocedamos un poco. No hace mucho tiempo, la idea de construir un motor MT personalizado parecía bastante lejana. Fue una tarea que requirió muchos recursos y que requirió una experiencia técnica sustancial. Por eso las opciones eran limitadas: Se podría hacer una inversión significativa, poseer conocimientos técnicos o confiar en un socio externo costoso.

Sin embargo, al igual que toda la tecnología, la personalización de la traducción automática evolucionó. Ya en 2017, varios proveedores de traducción automática comenzaron a explorar formas de hacer que la personalización fuera más accesible. El objetivo era dotar a los entusiastas de los idiomas y a los desarrolladores de la capacidad de crear soluciones de traducción automática personalizadas sin tener que gastar mucho dinero.

En 2018, Google presentó AutoML, una herramienta innovadora destinada a democratizar el proceso de personalización de la traducción automática. Sundar Pichai, director ejecutivo de Google, capturó sucintamente su esencia:

Esperamos que AutoML aproveche una capacidad que algunos doctores tienen hoy en día y que permita a cientos de miles de desarrolladores diseñar nuevas redes neuronales para sus necesidades particulares en un plazo de tres a cinco años.

Hoy en día, el paisaje es muy diferente. Tiene acceso a una variedad de motores MT personalizables, además de motores genéricos que ofrecen diversos grados de personalización.

Lo que antes era un esfuerzo prohibitivo en cuanto a costes ahora se ha transformado en un recurso accesible para quienes buscan precisión y excelencia en sus traducciones.

The present and future of machine translation study cover.jpg | Phrase

Download for free

Your up-to-the-minute guide to machine translation

Learn about new technologies to improve machine translation output quality, the latest on MT post-editing pricing models, and how to best shop for machine translation.

Download guide

El valor de la personalización de MT

La traducción automática personalizada no solo aporta la potencia de los motores de traducción automática genéricos, sino que va más allá. En una carrera de traducción en la que el tiempo es esencial, la traducción automática personalizada mantiene el ritmo y procesa rápidamente grandes volúmenes de texto. Le ayuda a evitar las laboriosas complejidades de la traducción humana y avanza como una solución rentable, liberando recursos que puede invertir para mejorar la calidad.

La calidad es precisamente lo que diferencia a la traducción automática personalizada de los motores de traducción automática genéricos.

La calidad de la traducción depende de la calidad de los modelos de traducción automática utilizados. Piense en los modelos entrenados en traducción automática personalizada como expertos en idiomas. Su profundo conocimiento de los matices lingüísticos garantiza traducciones de calidad superior. Esta habilidad perfeccionada significa menos obstáculos en el camino de la traducción y una postedición de traducción automática mínima o nula.

Con una mayor eficiencia y una calidad y precisión sin precedentes, las empresas globales pueden lanzar rápidamente contenido multilingüe y asignar recursos de forma estratégica para mejorar la experiencia general del cliente. Esto, a su vez, se traduce en una mejor percepción de la marca, una mayor participación de los clientes y un aumento de las conversiones en todos los mercados, lo que impulsa un crecimiento sostenido de la empresa en el escenario internacional.

¿Quién puede beneficiarse de la personalización de MT?

A medida que la personalización de la traducción automática se ha vuelto más accesible, ahora es un recurso que puede aprovechar una gama más amplia de usuarios.

Por un lado, cualquier organización que tenga una cantidad suficiente de datos de traducción adecuados para la formación puede aprovechar esta transformación. Los avances recientes en la personalización de la traducción automática han reducido considerablemente el volumen de datos necesario. Una memoria de traducción (TM) lo suficientemente grande es todo lo que necesita para empezar a ampliar sus capacidades lingüísticas.

Por otro lado, las organizaciones que navegan por grandes volúmenes de contenido dentro de dominios específicos se beneficiarán significativamente.

Cómo se benefician sectores específicos de la personalización de la traducción automática
Comercio electrónico y venta minorista online En el sector del comercio electrónico y la venta minorista en línea, los motores de traducción automática personalizados pueden traducir las descripciones de los productos y las opiniones de los usuarios, lo que mejora la experiencia de compra general.
Viajes y hostelería Dentro de la industria de viajes y hostelería, los listados de propiedades y las opiniones de los usuarios se pueden renderizar con un toque personal.
SaaS (software como servicio) Las empresas de software pueden beneficiarse de la documentación de usuario, el contenido de ayuda y los manuales que se adaptan a la jerga y terminología específicas de su sector.
Automoción Los fabricantes de automóviles pueden beneficiarse de la personalización de MT para diversos materiales, incluidos los comentarios de los clientes, los comentarios de los concesionarios, los manuales y los protocolos de producción, con un valor comercial proyectado de varios millones, como en el caso de BMW.
Finanzas y fintech En la industria financiera y fintech, la personalización de la traducción automática resulta valiosa para traducir con precisión el vocabulario específico de la industria, incorporar terminología relacionada con el riesgo y alinearse con el tono preferido de cada cliente para la documentación de cumplimiento, las regulaciones y los informes financieros.
Farmacéutico La industria farmacéutica puede transformar los desafíos de traducción de la jerga médica incluida en las recetas, las patentes, los ensayos clínicos, los resultados de las pruebas y el material de marketing en beneficios que garanticen la máxima precisión y fluidez con sistemas personalizados.

¿Cuáles son los tipos de personalización de MT?

Hay dos formas principales de personalización de la traducción automática: ligera y completa. La elección entre una personalización automática ligera o completa depende de la naturaleza de su proyecto de traducción y del nivel de precisión deseado.

Es similar a seleccionar tu atuendo para un viaje: Un atuendo ligero se adapta a un fin de semana familiar, mientras que un traje completo es ideal para un viaje de negocios. Cuanto más pase del contenido general al específico de la industria, mayor será la personalización requerida.

Personalización de Light MT

La personalización de Light MT implica ajustar las funciones específicas del motor para ajustar las traducciones. Piense en ello como ajustar los diales de una radio para obtener la mejor calidad de sonido. Esto incluye, entre otras cosas:

  • Adaptación del glosario
  • Listas de «no traducir»
  • Adaptación de memorias de traducción
  • Control estilístico

Por ejemplo, la función de formalidad de DeepL permite personalizar la iluminación.

Personalización completa de MT

La personalización completa de MT lleva el proceso un paso más allá. Implica entrenar un motor de traducción automática utilizando conjuntos de datos cuidadosamente seleccionados para generar traducciones que capturen con precisión la jerga, la terminología, el estilo y el tono de voz.

Básicamente, la personalización completa de la traducción automática da como resultado un motor de traducción que habla su idioma, tanto en sentido figurado como literal.

¿Cómo preparar los datos para la personalización de la traducción automática?

Hace poco, las organizaciones necesitaban alimentar millones de segmentos para entrenar un motor de traducción automática. Sin embargo, esos días ya pasaron: el proceso ahora necesita considerablemente menos segmentos.

La clave para entrenar un motor de traducción automática son los datos bilingües. Cuanto mayor sea el volumen y la variedad de datos bilingües de calidad, mejor equipado estará el motor para generar traducciones de alta calidad a largo plazo.

Tipos de datos clave utilizados para la personalización de la traducción automática

Hay dos pilares de datos que sustentan la personalización de la traducción automática: las memorias de traducción y los corpus.

Memorias de traducción

Las memorias de traducción (TM) constituyen la base de la evolución lingüística. Se han vuelto accesibles y familiares para la mayoría de las organizaciones que operan en el sector de la traducción y la localización.

Hace solo unos años, los MT se consideraban principalmente repositorios de traducciones revisadas por humanos. Sin embargo, ahora tienen un valor incalculable a la hora de configurar la trayectoria de los motores de traducción automática, ya que los guían para replicar contenido con una precisión extraordinaria.

Corpora

Los corpus son colecciones grandes y estructuradas de textos en varios idiomas. Estos textos son conjuntos de datos cuidadosamente seleccionados adquiridos de fuentes externas y seleccionados para que sirvan como datos de entrenamiento para los modelos de MT.

Al complementar los datos de TM, los corpus funcionan con gran eficacia, lo que mejora tanto la eficiencia como la precisión, especialmente en combinaciones de idiomas específicas y dominios especializados.

Adoptar los corpus enriquece el proceso de localización, ya que fomenta un enfoque integral que aprovecha las fortalezas inherentes de los recursos lingüísticos internos y externos.

Dive deeper

10 key steps to creating a machine translation strategy

Learn how to design a machine translation strategy that can help your brand connect with international customers at full speed.

Discover steps

Mejores prácticas para la limpieza de datos de traducción automática

Los MT y los corpus son los bloques de datos fundamentales para la personalización de MT. Para dotar a tu motor personalizado de una base sólida, es esencial preparar primero los datos de entrenamiento cuidadosamente seleccionados. Para ello, la limpieza de datos es fundamental.

Existen varias técnicas que pueden ayudarle a refinar y mejorar la calidad de los datos, optimizando el rendimiento del motor:

  • Filtrar segmentos por edad
  • Alinee los segmentos de origen y destino
  • Longitud del segmento
  • Eliminar los no traducibles
  • Eliminar duplicados
  • Verificación de idioma
  • Etiquetas en línea

Anteriormente, la limpieza de datos se basaba en una revisión manual exhaustiva (y costosa), pero una gran parte de la preparación de los datos ahora se puede automatizar. Todas estas estrategias funcionan en sinergia para refinar y limpiar los datos y, en última instancia, mejorar la eficacia del proceso de formación. Echemos un vistazo a cada uno de ellos.

Filtrar segmentos por edad

Para ciertos tipos de documentos, filtrar los segmentos de TM en función de su antigüedad es una técnica fundamental para limpiar los datos de la MT, ya que la eficiencia del entrenamiento del motor está influenciada por la adaptación de la antigüedad del segmento al contenido.

La regla de oro es mantener el equilibrio adecuado entre puntualidad y relevancia para garantizar una formación precisa. Utilizar segmentos demasiado anticuados o demasiado actuales puede resultar contraproducente, especialmente cuando se trata de memorias de traducción heredadas o heredadas cuya calidad, origen, atributos y uso histórico no están controlados. 

Alinee los segmentos de origen y destino

La puntualidad va de la mano de la precisión: aquí es donde entra en juego la alineación de los segmentos de origen y destino. Es imprescindible validar meticulosamente que los pares de segmentos destinados al entrenamiento transmitan con precisión el mismo significado. Esta alineación protege contra cualquier discrepancia o inconsistencia que pueda afectar negativamente al rendimiento del motor MT.

Compruebe la longitud del segmento

La longitud de los segmentos también es crucial en el refinamiento de los datos. Los pares de segmentos que son excesivamente largos o inusualmente cortos pueden afectar la calidad de la MT. También puede ser necesario hacerlo por razones puramente técnicas, ya que algunos motores MT personalizables suelen imponer restricciones de longitud de segmento.

Para solucionar este problema, puedes aplicar técnicas como implementar un recuento mínimo de caracteres, establecer pautas para la longitud de los pares de oraciones y mantener una proporción de longitud equilibrada.

Eliminar los no traducibles

El siguiente paso es eliminar los elementos no traducibles. Algunas palabras o frases pueden carecer de traducciones directas entre idiomas y otras no requieren traducción alguna, por ejemplo, nombres y direcciones. Es recomendable eliminarlos de los datos para evitar confusiones e imprecisiones en el proceso de traducción.

Eliminar duplicados

Evitar la redundancia de datos es igual de importante. La eliminación de pares de segmentos repetidos o casi idénticos ayuda a mantener la integridad de los datos y evita una influencia indebida en la salida de MT.

Comprobaciones de idioma

Los controles de idioma también son importantes. A veces, las memorias de traducción utilizadas para la personalización pueden contener pares de segmentos con una combinación de idiomas incorrecta. Asegurarse de que todos los segmentos se alineen con el idioma deseado es vital para mantener una personalización coherente y precisa.

Etiquetas en línea

Llama la atención la existencia de etiquetas en línea en las memorias de traducción. Es posible que estas etiquetas, que suelen indicar variables o un formato especial, no se admitan de forma coherente en los distintos motores de traducción automática. Por eso, en algunos casos, vale la pena excluirlos de los datos de formación para evitar posibles incoherencias en los resultados de la traducción.

Machine transtion report key visual | Phrase

Interactive MT report: Uncover top performers

Find out how leading machine translation engines perform for different content types using the latest data in our quarterly machine translation report.

Get MT insights

Un breve vistazo a la formación de modelos MT personalizados

El ámbito de la personalización de la traducción automática es complejo y revela un panorama dinámico de entrenamiento de modelos de traducción automática personalizados. A continuación se muestra un resumen de los modelos MT más populares con soporte de personalización:

  • Amazon Active Custom Translation ofrece una plataforma ágil basada en las aportaciones de los usuarios que muestra la colaboración entre humanos y máquinas.
  • Globalese Custom NMT combina las redes neuronales con la edición posterior avanzada, lo que garantiza una adaptación meticulosa.
  • Google AutoML Translation refina los modelos mediante el aprendizaje iterativo.
  • IBM Custom NMT surge como un ejemplo de precisión impulsada por la IA, mientras que el aprendizaje adaptativo de Microsoft Custom Translator captura las complejidades del contexto.
  • RWS Language Weaver se centra en la especificidad del dominio, lo que garantiza una comprensión sólida.
  • SDL PNMT y Systran PNMT presentan modelos neuronales de vanguardia para combinaciones de idiomas complejas.
  • Tilde es una jugadora experimentada que integra su experiencia lingüística.
  • Yandex Translate Custom fomenta traducciones ajustadas.
  • Phrase NextMT es el primer motor de traducción automática neuronal desarrollado con un sistema de gestión de traducciones en mente, que proporciona a los clientes de Phrase un mayor grado de personalización, automatización, integración y una elaboración superior de informes. Ahora, gracias a la plataforma Phrase Custom AI, admite una personalización total. 

Qué se necesita para entrenar un modelo MT personalizado

La formación de un modelo de traducción automática personalizado suele consistir en varios pasos, funciones y plazos. En el caso de Microsoft Custom Translator, Google Translate AutoML y Active Custom Translation de Amazon, las personas con experiencia técnica desempeñan funciones cruciales e invierten aproximadamente:

  • Más de 10 minutos para la creación de la cuenta
  • Más de 30 minutos para la configuración inicial
  • Más de 30 horas para la preparación de datos en paralelo
  • Más de 30 minutos de facturación
  • Más de 6 horas de formación

Alternativamente, con Phrase Custom AI, el proceso de entrenamiento del modelo personalizado se vuelve más ágil y fácil de usar. Ahora es posible reducir significativamente el tiempo, la experiencia y los recursos necesarios para entrenar su propio motor de traducción automática personalizado.

Gracias a Phrase Custom AI, un proceso que antes llevaba semanas ahora se puede realizar en cuestión de horas. Phrase Custom AI utiliza un filtrado de datos impulsado por IA, una evaluación automática y una interfaz intuitiva para que la personalización del motor esté disponible para todos.

Evaluación y ajuste del modelo MT en gráficos

El viaje de la traducción automática no se limita a la formación de un modelo, es solo el comienzo. El éxito de los modelos de traducción automática depende de un cuidadoso proceso de evaluación y ajuste. Puede evaluar la calidad de los modelos de traducción automática mediante métricas automatizadas, métricas posteriores a la edición y mediante una evaluación humana.

Métodos de evaluación de la traducción automática
Métricas automatizadas BLEU, COMET, TER, chrf3 y METEOR proporcionan información cuantificable sobre la fidelidad de la traducción.
Evaluación humana Incluye cuestionarios estandarizados para capturar matices que solo son comprensibles para los humanos.
Métricas posteriores a la edición El TER, el tiempo de edición, la distancia de edición, el tiempo de reflexión y más ofrecen medidas concretas de precisión y eficiencia de la traducción.

Tu destino está justo delante: Personalización MT

El proceso de personalización de la traducción automática no se detiene después de una sola evaluación, sino que continúa con una evaluación continua y periódica. Esta expedición continua permite a los motores de traducción automática adaptarse sin problemas al panorama lingüístico en constante cambio.

Al igual que los exploradores actualizan los mapas antes de embarcarse en nuevos viajes, los motores de traducción automática personalizados se reentrenan periódicamente con datos actualizados. Este proceso perfecciona sus habilidades y mejora su rendimiento, lo que da como resultado traducciones que incorporan la excelencia práctica, personalizadas según el contexto y el idioma de la empresa, lo que significa un importante retorno de la inversión.

Unlock the power of machine translation

Discover advanced machine translation management features within our enterprise-ready TMS and create new business opportunities worldwide more quickly and efficiently.

Explore solutions