Mundo. – OpenAI, es la empresa del conocido ChatGPT, ha dado a conocer grandes avances significativos en su herramienta Voice Engine, capaz de crear voces sintéticas usando solo 15 segundos de audio como muestra.
La compañía ha demostrado en su blog, la capacidad del software para replicar sonidos emotivos y realistas con Inteligencia Artificial (IA).
Dicha voz generada puede interpretar textos en diferentes idiomas.
OpenAI just launched Voice Engine,
It uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker.
Reference and Generated audio is very close and hard to differentiate.
More details in pic.twitter.com/tJRrCO2WZP— AshutoshShrivastava (@ai_for_success) March 29, 2024
La tecnología inició su desarrollo a finales de 2022, está en una fase de acceso previo limitado, disponible para un selecto grupo de desarrolladores, de acuerdo con Jeff Harris, miembro del equipo de producto.
Aún no se ha dado a conocer si OpenAI tiene planes de lanzar este servicio al público, similar a como lo hizo con ChatGPT.