El traductor es desarrollado por Frank Soong de Microsoft Research y fue presentado en el TechFest 2012 que se desarrolla en Redmond. Aunque comprende alrededor de 26 idiomas, como el español, italiano y el chino mandarín entre otros, representaría un puñado de lenguajes comparado con la capacidad de C3-PO.
El sistema fue demostrado por Craig Mundie, Jefe de investigación y de estrategia tecnológica, cuando dio la bienvenida en video durante la reunión de Microsoft Research hablando en su idioma nativo, el inglés. Posteriormente, fue traducido en chino y japonés. La cabeza de Mundie se obtuvo mediante un sistema fotorrealista en 3D, luego se ajustó la sincronización de sus labios y se modificó el movimiento de estos aparentando que habla en otro idioma.
El nuevo traductor sería útil en el aprendizaje de idiomas al escuchar frases sencillas de imitar. También, estaría en los sistemas de navegación en los teléfonos móviles, permitiendo que una acción en idioma inglés sea capaz de leer el texto escrito en otro (como el chino) respecto a las señales de tráfico, transmitiendo las instrucciones de una ruta en las calles de una ciudad en el extranjero. E indiscutiblemente estaría presente en los diversos servicios turísticos, así como en los viajes de negocios.
La desventaja que tiene el sistema es que requiere de una hora para aprender a desarrollar un modelo capaz de leer cualquier texto con la voz de una persona. Durante ese lapso de tiempo, se compara con un diccionario de texto a voz para el lenguaje de destino. Los sonidos individuales utilizados por el primer modelo construyen las palabras con la voz de la persona en su idioma nativo, ajustándose cuidadosamente para que en el idioma de destino haya plena capacidad para pronunciar las frases.
El equipo de Microsoft Research trabaja en afinar el traductor en otros rubros como el énfasis, la entonación y en cómo las personas utilizan las pausas o al titubear, afectando la efectividad y la calidad de una traducción palabra por palabra.
Es probable que en el futuro, al visitar un país o un planeta, tengamos que sacar nuestro smartphone o dispositivo traductor y lo acerquemos con la persona o alienígena con quién queremos hablar evitando que nos vean con la cara de “What?”.