OpenAI revoluciona la IA con nuevos modelos de voz y transcripción

OpenAI presenta dos nuevos modelos de audio basados en GPT-4o, mejorando la transcripción de voz a texto y la personalización de texto a voz. Estos avances marcan un hito en la evolución de la inteligencia artificial aplicada al audio.
Agencia de Noticias Fides - Bolivia
Logotipo con una espiral seguido de texto en la pantalla de un dispositivo.
Imagen que presenta un logotipo reconocible junto a un nombre en la pantalla de un dispositivo móvil.

OpenAI revoluciona la inteligencia artificial con nuevos modelos de voz y transcripción

OpenAI, la empresa líder en inteligencia artificial, ha presentado dos nuevos modelos de audio que mejoran la transcripción de voz a texto y la conversión de texto a voz. Estos avances, basados en GPT-4o y GPT-4o mini, buscan ofrecer mayor precisión y personalización, permitiendo a los desarrolladores incorporar voces propias en sus aplicaciones. El anuncio se realizó el 21 de marzo de 2025, marcando un nuevo hito en la evolución de la IA.

Mejoras en la transcripción de voz a texto

El modelo gpt-4o-transcribe reduce significativamente la tasa de error en la transcripción de audio, gracias a innovaciones en el aprendizaje por refuerzo y el uso de conjuntos de datos de alta calidad. OpenAI asegura que este avance supera a su anterior modelo, Whisper, utilizado ampliamente en aplicaciones de reconocimiento de voz. \»La precisión en la transcripción es clave para aplicaciones en sectores como la medicina, la educación y los servicios al cliente\», destacó un portavoz de la empresa.

Personalización en la conversión de texto a voz

Por otro lado, el modelo gpt-4o-mini-tts permite a los desarrolladores no solo elegir qué decir, sino también cómo decirlo, ofreciendo una experiencia más personalizada. Este avance abre nuevas posibilidades en la creación de asistentes virtuales, audiolibros y herramientas de accesibilidad. \»La capacidad de personalizar la voz es un paso importante hacia una interacción más humana con la tecnología\», explicó OpenAI en su blog oficial.

El futuro de la inteligencia artificial en audio

OpenAI planea seguir mejorando la inteligencia y precisión de sus modelos de audio, con el objetivo de que los desarrolladores puedan integrar voces personalizadas en sus proyectos. Este enfoque no solo amplía las posibilidades creativas, sino que también refuerza la importancia de la ética en el uso de la IA, especialmente en contextos donde la voz humana puede ser replicada o manipulada.

Contexto histórico: La evolución de la IA en audio

La inteligencia artificial aplicada al audio ha experimentado un crecimiento exponencial en la última década. Desde los primeros sistemas de reconocimiento de voz hasta los actuales modelos de conversión de texto a voz, la tecnología ha avanzado para ofrecer mayor naturalidad y precisión. OpenAI ha sido pionera en este campo, con modelos como Whisper y GPT-4, que han establecido nuevos estándares en la industria.

Sin embargo, estos avances también han generado debates sobre el uso ético de la IA, especialmente en áreas como la creación de \»deepfakes\» o la manipulación de voces. La transparencia y el control sobre estas tecnologías serán claves para garantizar su uso responsable.

Fuentes y transparencia

La información presentada en esta noticia proviene del anuncio oficial de OpenAI, publicado en su blog el 21 de marzo de 2025. Además, se han consultado declaraciones de expertos en inteligencia artificial y análisis de la evolución de los modelos de audio en los últimos años.

Los nuevos modelos de OpenAI representan un avance significativo en la inteligencia artificial aplicada al audio, con implicaciones en sectores como la educación, la salud y el entretenimiento. Sin embargo, su éxito dependerá de cómo se gestionen los desafíos éticos y técnicos asociados a estas tecnologías. En los próximos meses, se espera que más desarrolladores integren estas herramientas en sus proyectos, marcando el inicio de una nueva era en la interacción humano-máquina.

 

Los trabajos de búsqueda y rescate continúan en Santa Cruz

Gobierno boliviano instala Sala de Crisis por inundaciones en Santa Cruz

Imagen sin título

Fallece tercer funcionario municipal en conflicto por botadero de Cotapachi

Inundación en el municipio de El Torno, Santa Cruz.

Suben a tres los muertos por el desborde del río Piraí en Santa Cruz

Funcionarios trasladan a uno de los afectados por el desborde del río Piraí.

Hallan un cuerpo sin vida y rescatan a 45 personas por desborde del río Piraí en El Torno

Imagen sin título

Lluvias en Santa Cruz dejan tres fallecidos y 18 desaparecidos

Imagen sin título

Rescatan a dos jóvenes y alertan por fuertes lluvias en la región metropolitana

El líder de ultraderecha José Antonio Kast, favorito para ganar las elecciones presidenciales en Chile.

José Antonio Kast, favorito para ganar la presidencia de Chile en balotaje

Imagen sin título

México confirma el primer caso de la ‘supergripe’ que colapsó hospitales en Europa

Imagen sin título

Tiroteo en la Universidad Brown deja al menos dos muertos y decenas de heridos

Imagen sin título

Inundaciones en El Torno dejan al menos cuatro muertos y decenas de desaparecidos

Imagen sin título

Hallan cuerpo de adulto mayor tras inundaciones en El Torno

El presidente Rodrigo Paz llegando a Achira cuando ocurrió el desastre en Samaipata

Presidente Rodrigo Paz viajará a El Torno para coordinar ayuda por inundaciones