top of page

La tecnología de Adobe empuja un nuevo concepto de traducción audiovisual para el doblaje de videoju



¿Cuántas veces hemos soñado los productores y jefes de proyectos de localización de la industria mundial en un programa que tradujese el texto escrito a la palabra hecha voz y sincronizada con los labios de los personajes protagonistas de los audiovisuales que aparecen en pantalla?

Algo que estaba en la ficción de los sueños más perniciosos para el mundo del doblaje ya está en las puertas de poder ser otra realidad al estilo más puro implantado por el profeta Julio Verne gracias a la tecnología e investigación de Adobe.


La compañía ha demostrado que la tecnología ya permite editar en un programa de texto escrito un discurso para que pueda alterar lo que una persona dice (habla) o crear una nueva frase con su voz sin que ella la haya emitido. Parece que la intención de Adobe es que salga al mercado con el nombre de "photoshop” pero para audio."

La tecnología, apodada Voco (conversión de voz), presenta al usuario un cuadro de texto donde inicialmente se muestra el contenido hablado del clip de audio. A continuación, puedes moverte alrededor de las palabras escritas, eliminar fragmentos, o escribir otras palabras totalmente nuevas. Cada palabra nueva añadida hace que el motor del programa analice la información textual y la convierta en una nueva palabra hablada. Durante el proceso hay una pequeña pausa mientras que el vocablo se construye, una vez terminado el proceso entonces se presiona la tecla entrar (enter) y milagrosamente escucharemos el nuevo clip modificado con claridad y una alta sensación de naturalidad.

El programa trabaja analizando y gestionando una gran cantidad de datos de voz (alrededor de 20 minutos en este momento, pero se trabaja para mejorarlo), dividiendo los sonidos en fonemas (cada uno de los distintos sonidos que componen una lengua hablada), para luego trata de crear un modelo de voz exacta al modelo que generó el patrón. Pero lejos de limitarse a unir en forma de puzle cada uno de los signos sonoros que componen una palabra y en continuidad la frase, trabaja sorprendentemente y con aparente eficacia sobre la carencia, musicalidad (sentido, entonación), presumiblemente la cadencia, emociones, tensiones, caprichos, etc., aunque hasta ahora no es más que una promesa pues Adobe no ha proporcionado muchos detalles todavía de esos logros. En pocas palabras estamos ante un editor de texto que convierte el trabajo de un guionista o traductor en el procesador de textos en la voz de una persona manteniendo indiferentemente del sentido de la frase la personalidad y el color de la voz de la persona patrón.


Resumiendo, cuando se edita el texto escrito también se logra el del habla de una persona, bien porque el programa encuentra esa palabra en alguna parte dentro del clip de 20 minutos, o, si la palabra no se ha pronunciado, se construye a partir de los fonemas primarios.

Son muchas las posibilidades profesionales, lúdicas e incluso delictivas que se abren ante las cualidades de este programa. Llevado al mundo de la traducción audiovisual y multimedia el hecho de que se trabaje el audio a generar sobre fonemas (sílabas), posibilita con un simple algoritmo matemático la sincronización perfecta en los labios de un personaje en pantalla en el caso de que se quisiera utilizar el programa para el doblaje de productos audiovisuales.

Cuando se reproduce la frase se percibe una muy ligerísima armonía sintética, pero no es desagradable y los creadores buscan la forma de eliminarla totalmente. Según parece esa leve aura robótica que se percibe, solo sucede cuando el programa crea la palabra desde cero a partir de fonemas pertenecientes a otras palabras grabadas en los 20 minutos mencionados y desaparece si esta está registrada en su totalidad. Es decir, que si Copiamos y pegamos palabras existentes suena natural. Nos queda la más que duda sobre si las sensaciones dramáticas se podrán generar con naturalidad y cómo sería posible conseguir humanizar la entonación en base al sentimiento del mensaje, situación escénica y continuidad dramática. ¿Pero quién nos iba a decir que podríamos estar fotografiando planetas que se encuentran a miles de años luz de nuestra galaxia hace escasamente diez años?


En el Medellín Conference Regional Partner se tocarán temas tan novedosos de la industria del doblaje, la locución y la traducción audiovisual como esté. ¿Te lo vas a perder? https://www.dlminternacional.com/conference-regional-partner

Un mundo de la comercialización internacional de los productos audiovisuales se abre alrededor de esta propuesta de adobe. Esta tecnología promete cambios radicales en el mundo de la sonorización y doblaje de películas y videojuegos entre otras muchas posibilidades lúdicas y profesionales. En pocas palabras, en el mundo de la traducción audiovisual y multimedia aparece como una gran luz de esperanza para agilizar la postproducción profesional y comercial de estos productos. En el otro lado de la moneda obliga a un cambio radical en la industria de la localización donde sobre todo los estudios de sonorización de doblaje tal y como los entendemos actualmente y la continuidad de la profesión dramática de los actores de doblaje se ven en el centro del huracán flamante.

Imaginemos por un momento que la voz de un famoso actor de Hollywood es registrada en el sistema Voco y desde la traducción a diferentes idiomas del guión original se reproduce sincrónicamente el audio de su personaje en tantos idiomas como versiones en el mercado se quiera comercializar. Esta posibilidad sería un sunami devastador en la industria del doblaje.

Otro escenario posible para este revolucionario proyecto lo encontraríamos si los desarrolladores de videojuegos pudiesen tener un acceso a un banco de voces famosas y tras el casting electrónico, se introdujese el registro del actor o actriz famosa elegida sin necesidad de que se tenga que desplazar y/o despeinarse a ningún estudio de grabación para interpretar los personajes animados.


La universidad aun con la resaca de retraso en la adaptación a estos entornos también se sentiría otra vez maltratada ante su lamentable incapacidad de actualizarse a la velocidad que la tecnología obliga. El mundo del estudio de la traducción audiovisual y multimedia se vería radicalmente modificado. Estaríamos ante un nuevo escenario donde el propio traductor utilizando herramientas elementales como un procesador de textos y un mezclador de audio desde su ordenador en su casa tendría la capacidad de sonorizar en diferentes idiomas un videojuego o producto audiovisual para cualquier multinacional del mundo.

Nada que decir a los formadores en programación de videojuegos. Una nueva asignatura aparece en producción, creación y desarrollo donde este adelanto invita a un ahorro de los costes de lanzamiento. La forma de vender e incluso de hacer visible comercialmente en todo el mundo sus productos sin tener que endeudarse como actualmente ocurre ante los gastos que serán descontados por la editora o distribuidora internacional en los acuerdos de comercialización que se nos descontarán de los beneficios de las ventas. Ahora se podrá generar versiones beta completamente sonorizadas según salgan del horno tanto en el inglés obligado de trabajo o en cualquier otro idioma focalizado indiferentemente de la nacionalidad y capacidades lingüísticas del equipo desarrollador.

Si Voco consigue que su prototipo solucione estas dudas mencionadas en este reportaje, es probable que se añadiría a Adobe Audition, donde se podría utilizar para todos los sectores profesionales mencionados.

¡QUÉ COSAS PASAN!

Entradas destacadas
Entradas recientes
Archivo
Buscar por tags
Síguenos
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square
bottom of page