OpenAI revoluciona la IA con nuevos modelos de voz y transcripción

OpenAI presenta dos nuevos modelos de audio basados en GPT-4o, mejorando la transcripción de voz a texto y la personalización de texto a voz. Estos avances marcan un hito en la evolución de la inteligencia artificial aplicada al audio.
Agencia de Noticias Fides - Bolivia
Logotipo con una espiral seguido de texto en la pantalla de un dispositivo.
Imagen que presenta un logotipo reconocible junto a un nombre en la pantalla de un dispositivo móvil.

OpenAI revoluciona la inteligencia artificial con nuevos modelos de voz y transcripción

OpenAI, la empresa líder en inteligencia artificial, ha presentado dos nuevos modelos de audio que mejoran la transcripción de voz a texto y la conversión de texto a voz. Estos avances, basados en GPT-4o y GPT-4o mini, buscan ofrecer mayor precisión y personalización, permitiendo a los desarrolladores incorporar voces propias en sus aplicaciones. El anuncio se realizó el 21 de marzo de 2025, marcando un nuevo hito en la evolución de la IA.

Mejoras en la transcripción de voz a texto

El modelo gpt-4o-transcribe reduce significativamente la tasa de error en la transcripción de audio, gracias a innovaciones en el aprendizaje por refuerzo y el uso de conjuntos de datos de alta calidad. OpenAI asegura que este avance supera a su anterior modelo, Whisper, utilizado ampliamente en aplicaciones de reconocimiento de voz. \»La precisión en la transcripción es clave para aplicaciones en sectores como la medicina, la educación y los servicios al cliente\», destacó un portavoz de la empresa.

Personalización en la conversión de texto a voz

Por otro lado, el modelo gpt-4o-mini-tts permite a los desarrolladores no solo elegir qué decir, sino también cómo decirlo, ofreciendo una experiencia más personalizada. Este avance abre nuevas posibilidades en la creación de asistentes virtuales, audiolibros y herramientas de accesibilidad. \»La capacidad de personalizar la voz es un paso importante hacia una interacción más humana con la tecnología\», explicó OpenAI en su blog oficial.

El futuro de la inteligencia artificial en audio

OpenAI planea seguir mejorando la inteligencia y precisión de sus modelos de audio, con el objetivo de que los desarrolladores puedan integrar voces personalizadas en sus proyectos. Este enfoque no solo amplía las posibilidades creativas, sino que también refuerza la importancia de la ética en el uso de la IA, especialmente en contextos donde la voz humana puede ser replicada o manipulada.

Contexto histórico: La evolución de la IA en audio

La inteligencia artificial aplicada al audio ha experimentado un crecimiento exponencial en la última década. Desde los primeros sistemas de reconocimiento de voz hasta los actuales modelos de conversión de texto a voz, la tecnología ha avanzado para ofrecer mayor naturalidad y precisión. OpenAI ha sido pionera en este campo, con modelos como Whisper y GPT-4, que han establecido nuevos estándares en la industria.

Sin embargo, estos avances también han generado debates sobre el uso ético de la IA, especialmente en áreas como la creación de \»deepfakes\» o la manipulación de voces. La transparencia y el control sobre estas tecnologías serán claves para garantizar su uso responsable.

Fuentes y transparencia

La información presentada en esta noticia proviene del anuncio oficial de OpenAI, publicado en su blog el 21 de marzo de 2025. Además, se han consultado declaraciones de expertos en inteligencia artificial y análisis de la evolución de los modelos de audio en los últimos años.

Los nuevos modelos de OpenAI representan un avance significativo en la inteligencia artificial aplicada al audio, con implicaciones en sectores como la educación, la salud y el entretenimiento. Sin embargo, su éxito dependerá de cómo se gestionen los desafíos éticos y técnicos asociados a estas tecnologías. En los próximos meses, se espera que más desarrolladores integren estas herramientas en sus proyectos, marcando el inicio de una nueva era en la interacción humano-máquina.

 

Imagen sin título

Policía bloquea acceso a la plaza Murillo con vallas metálicas durante protesta

La marihuana en estado húmedo incautada en un operativo.

Bolivia incauta más de dos toneladas de marihuana en un operativo en Cochabamba

Imagen sin título

Presidente Paz establece seis ejes estratégicos para la Policía Boliviana

El presidente de Yacimientos Petrolíferos Fiscales Bolivianos, Armin Dorgathen.

Diputado responsabiliza a fiscales y autoridades por fuga del ex presidente de YPFB

El exgerente de Emapa, Franklin Flores (izq). La esposa de Flores aprehendida por la Policía (der)

Esposa del exgerente de Emapa aprehendida en La Paz y aguarda imputación

Una mujer se protege de la lluvia con un paraguas.

Senamhi pronostica lluvias intensas con tormentas en cinco departamentos bolivianos

El ex presidente de Brasil, Jair Bolsonaro, y su hijo Flavio, en una imagen de 2019, en Brasilia.

Flávio Bolsonaro anuncia que su padre lo designa como sucesor político para 2026

Imagen sin título

Policía de Bolivia halla asesinado a ciudadano peruano secuestrado en Ichilo

Imagen sin título

Trasladan a la exdiputada Lidia Patty a la FELCC por caso Fondo Indígena

El presidente Rodrigo Paz durante el acto de egreso de oficiales de la Policía Nacional.

Presidente Paz presenta seis ejes para transformar la Policía Boliviana

Victima de 'la calancha'.

Víctima de «La Calancha» acusa a Evo Morales de masacre y exige su aprehensión

El presidente Rodrigo Paz y el vicepresidente Edmand Lara, en un acto de la Anapol.

Presidente y vicepresidente de Bolivia reaparecen juntos en acto policial