¿Qué IA traduce mejor? ¿La de Google, Microsoft o DeepL?
Hemos hecho una prueba para comprobar cómo traducen las inteligencias artificiales de 'Goliat' Google y Microsoft, y la de 'David' DeepL. ¿Tú qué opinas?
El jueves pasado una compañía alemana, DeepL, anunciaba a bombo y platillo que había vuelto a batir un nuevo récord en calidad de traducción basada en inteligencia artificial (IA). Es más, la citada compañía señalaba que está muy por delante del traductor de Google y del traductor Bing de Microsoft en lo que a calidad respecta. Y decía que es la primera vez que un nuevo sistema permite a todos traducir sin error incluso textos largos y complejos. Se atrevía, además, a señalar que los traductores profesionales escogieron las traducciones de DeepL cuatro veces más que las de cualquier otro traductor.
Para comprobar la calidad de su traducción, frente a otros, proponía un ejercicio que he realizado y que voy a mostrar a continuación. Pedía DeepL que escogiera un texto cualquiera y lo pegara a cada uno de los traductores de Google, Bing de Microsoft y al suyo propio, el de DeepL. Y es lo que he hecho y muestro a continuación para que quien lea este artículo saque su propia conclusión. Al final, también incluyo la traducción correcta de un traductor profesional.
Para comprobar la calidad de su traducción, frente a otros, proponía un ejercicio que he realizado y que voy a mostrar a continuación. Pedía DeepL que escogiera un texto cualquiera y lo pegara a cada uno de los traductores de Google, Bing de Microsoft y al suyo propio, el de DeepL. Y es lo que he hecho y muestro a continuación para que quien lea este artículo saque su propia conclusión. Al final, también incluyo la traducción correcta de un traductor profesional.
El texto que he elegido es un texto en ruso, idioma del que tengo total desconocimiento, escogido al azar en Internet. Es el siguiente: Девя́тое ма́я – э́то осо́бый день для всех ру́сских люде́й. Э́то День Побе́ды. Э́то день, когда́ зако́нчилась Вели́кая Оте́чественная война́ (так в Росси́и называ́ют Втору́ю мирову́ю войну́).
Si comprobamos las traducciones de los distintos sistemas que utilizan inteligencia artificial, hay algunas diferencias. DeppL lo traduce el texto de la siguiente manera: ‘El noveno mes de mayo es un día importante para todo el pueblo ruso. Este es el Día de la Victoria. Es el día en que terminó la Gran Guerra Patria (como se llama la Segunda Guerra Mundial en Rusia)’.
Si comprobamos las traducciones de los distintos sistemas que utilizan inteligencia artificial, hay algunas diferencias. DeppL lo traduce el texto de la siguiente manera: ‘El noveno mes de mayo es un día importante para todo el pueblo ruso. Este es el Día de la Victoria. Es el día en que terminó la Gran Guerra Patria (como se llama la Segunda Guerra Mundial en Rusia)’.
Por su parte, Google Translator hace la siguiente traducción: ‘El nueve de mayo es un día especial para todos los rusos. Este es el día de la victoria. Este es el día en que terminó la Gran Guerra Patria (como llaman a la Segunda Guerra Mundial en Rusia)’.
Y el traductor Bing de Microsoft con IA dice: ‘El último día es un día para todo el Pueblo de la República. Es el día de Pobeda. Este es el día en que la Guerra del Gran Padre (como Rusia llama la Segunda Guerra Mundial) ha comenzado’.
Y el traductor Bing de Microsoft con IA dice: ‘El último día es un día para todo el Pueblo de la República. Es el día de Pobeda. Este es el día en que la Guerra del Gran Padre (como Rusia llama la Segunda Guerra Mundial) ha comenzado’.
La traducción correcta es: ‘El 9 de mayo es un día especial para todos los rusos. Es el Día de la Victoria. Es el día cuando finalizó la Gran Guerra Patriótica (así llaman en Rusia a la Segunda Guerra Mundial)’.
¿Cuál de las tres traducciones se acerca más a la realidad? En mi opinión parece que la de Google se acerca más a la realizada por el profesional. Y la de DeepL, parece, no se ajusta mucho a la correcta. La de Micrsoft tampoco parece la más adecuada. ¿Quién tiene la culpa? ¿La inteligencia artificial que utiliza cada uno? ¿Sus algoritmos? ¿Las redes neuronales que utiliza cada uno? ¿O las personas que han programado los algoritmos y han desarrollado la aplicación?
¿Cuál de las tres traducciones se acerca más a la realidad? En mi opinión parece que la de Google se acerca más a la realizada por el profesional. Y la de DeepL, parece, no se ajusta mucho a la correcta. La de Micrsoft tampoco parece la más adecuada. ¿Quién tiene la culpa? ¿La inteligencia artificial que utiliza cada uno? ¿Sus algoritmos? ¿Las redes neuronales que utiliza cada uno? ¿O las personas que han programado los algoritmos y han desarrollado la aplicación?
DeepL dice que su nuevo sistema de traducción ha sido evaluado científicamente mediante tests “a ciegas”. Se tradujeron 119 pasajes de una extensión considerable y procedentes de diferentes ámbitos empleando el traductor de DeepL y otros sistemas de la competencia, como los traductores de Google o Microsoft. Las traducciones se presentaron a traductores profesionales para evaluarlas y escoger la mejor de ellas sin conocer el sistema del que provenía cada una. Los traductores se decantaron por las traducciones de DeepL. ¿Tú qué opinas?