Google genera una voz artificial casi tan precisa como la de un ser humano

Esta tecnología, llamada Tacotron 2, se basa en dos redes neuronales capaces de interpretar el texto y aplicar los efectos, pausas y entonaciones. Ha sido desarrollada por el laboratorio Deepmind, responsable de la Inteligencia Artificial (IA) de la compañía. Se pueden escuchar varios ejemplos en la página de página de Google en GitHub.

Google desarrolla, a través del laboratorio Deepmind, responsable de la Inteligencia Artificial (IA) de la compañía, una voz sintética de una precisión casi idéntica a la generada por un ser humano. Esta tecnología recibe el nombre de Tacotron 2, cuyo funcionamiento esta basado en dos redes neuronales capaces de interpretar el texto y aplicar los efectos, pausas y entonaciones que estén presentes en el mismo.

Desde el portal Quartz indican que una de las novedades de esta versión es la capacidad de pronunciar nombres y palabras difíciles, así como distinguir los signos de puntuación o si una parte del texto requiere ser pronunciada con una entonación diferente. Este sistema permite transformar el texto en discurso primero, recreando el texto en un espectrograma, es decir, plasmando de forma gráfica las palabras en forma de ondas para que el software de Google Wavenet las interprete y posteriormente las transforme en voz.

Hasta el momento, Tacotron 2 se encuentra en fase de prueba, disponible únicamente en inglés e interpretado por una voz femenina, como se puede comprobar en la página de Google en GitHub, donde la compañía ha compartido ejemplos de audio.

Gongora's machine site

Google genera una voz artificial casi tan precisa como la de un ser humano

Tags