| Inteligencia Artificial | Tecnología |

OpenAI revoluciona la IA con nuevos modelos de voz y transcripción

Agencia de Noticias Fides - Bolivia

OpenAI lanza nuevos modelos para la transcripción y la conversión a voz - Agencias de Noticias Fides
Agencia de Noticias Fides
Agencia de Noticias Fides - Bolivia
es_ES
Publicado el: 1742670599797
1742670599
https://www.noticiasfides.com/ciencia-y-tecnologia/openai-lanza-nuevos-modelos-para-la-transcripcion-y-la-conversion-a-voz

OpenAI presenta dos nuevos modelos de audio basados en GPT-4o, mejorando la transcripción de voz a texto y la personalización de texto a voz. Estos avances marcan un hito en la evolución de la inteligencia artificial aplicada al audio.

OpenAI revoluciona la inteligencia artificial con nuevos modelos de voz y transcripción

OpenAI, la empresa líder en inteligencia artificial, ha presentado dos nuevos modelos de audio que mejoran la transcripción de voz a texto y la conversión de texto a voz. Estos avances, basados en GPT-4o y GPT-4o mini, buscan ofrecer mayor precisión y personalización, permitiendo a los desarrolladores incorporar voces propias en sus aplicaciones. El anuncio se realizó el 21 de marzo de 2025, marcando un nuevo hito en la evolución de la IA.

Mejoras en la transcripción de voz a texto

El modelo gpt-4o-transcribe reduce significativamente la tasa de error en la transcripción de audio, gracias a innovaciones en el aprendizaje por refuerzo y el uso de conjuntos de datos de alta calidad. OpenAI asegura que este avance supera a su anterior modelo, Whisper, utilizado ampliamente en aplicaciones de reconocimiento de voz. \»La precisión en la transcripción es clave para aplicaciones en sectores como la medicina, la educación y los servicios al cliente\», destacó un portavoz de la empresa.

Personalización en la conversión de texto a voz

Por otro lado, el modelo gpt-4o-mini-tts permite a los desarrolladores no solo elegir qué decir, sino también cómo decirlo, ofreciendo una experiencia más personalizada. Este avance abre nuevas posibilidades en la creación de asistentes virtuales, audiolibros y herramientas de accesibilidad. \»La capacidad de personalizar la voz es un paso importante hacia una interacción más humana con la tecnología\», explicó OpenAI en su blog oficial.

El futuro de la inteligencia artificial en audio

OpenAI planea seguir mejorando la inteligencia y precisión de sus modelos de audio, con el objetivo de que los desarrolladores puedan integrar voces personalizadas en sus proyectos. Este enfoque no solo amplía las posibilidades creativas, sino que también refuerza la importancia de la ética en el uso de la IA, especialmente en contextos donde la voz humana puede ser replicada o manipulada.

Contexto histórico: La evolución de la IA en audio

La inteligencia artificial aplicada al audio ha experimentado un crecimiento exponencial en la última década. Desde los primeros sistemas de reconocimiento de voz hasta los actuales modelos de conversión de texto a voz, la tecnología ha avanzado para ofrecer mayor naturalidad y precisión. OpenAI ha sido pionera en este campo, con modelos como Whisper y GPT-4, que han establecido nuevos estándares en la industria.

Sin embargo, estos avances también han generado debates sobre el uso ético de la IA, especialmente en áreas como la creación de \»deepfakes\» o la manipulación de voces. La transparencia y el control sobre estas tecnologías serán claves para garantizar su uso responsable.

Fuentes y transparencia

La información presentada en esta noticia proviene del anuncio oficial de OpenAI, publicado en su blog el 21 de marzo de 2025. Además, se han consultado declaraciones de expertos en inteligencia artificial y análisis de la evolución de los modelos de audio en los últimos años.

Los nuevos modelos de OpenAI representan un avance significativo en la inteligencia artificial aplicada al audio, con implicaciones en sectores como la educación, la salud y el entretenimiento. Sin embargo, su éxito dependerá de cómo se gestionen los desafíos éticos y técnicos asociados a estas tecnologías. En los próximos meses, se espera que más desarrolladores integren estas herramientas en sus proyectos, marcando el inicio de una nueva era en la interacción humano-máquina.

Post Views: 72

| Economía |

agosto 3, 2025

Candidatos a diputados en Cochabamba presentan propuestas clave

Cuatro aspirantes legislativos enfocan sus planes en reactivación económica y seguridad jurídica, con propuestas para gestión de residuos, infraestructura

| Política |

agosto 3, 2025

Jhonny Fernández anuncia vicepresidente del occidente para elecciones

Jhonny Fernández, candidato presidencial por Fuerza del Pueblo, confirmó que su compañero de fórmula será alguien del occidente boliviano,

| Política |

agosto 3, 2025

APB-Súmate intensifica campaña electoral en La Paz con caravanas

Manfred Reyes Villa lidera caravanas en el centro de La Paz para reforzar apoyo electoral a 13 días de

| Robos y atracos |

agosto 3, 2025

Atraco armado en Buena Vista: roban camioneta y objetos de valor

Dos delincuentes fingieron una avería para acceder a una vivienda en Buena Vista, robaron una camioneta 4×4, dispositivos electrónicos

| Delitos sexuales |

agosto 3, 2025

Investigan muerte de mujer en motel de Santa Cruz

La FELCC investiga el hallazgo sin vida de una mujer en un motel de la avenida Alemania. Se esperan

| Corrupción y Ética |

agosto 3, 2025

Candidato denuncia manipulación en encuestas electorales en Bolivia

Juan Carlos Medrano, candidato vicepresidencial, acusa a encuestadoras de promover el ‘voto útil’ y vincula estas prácticas con estrategias

| Corrupción y Ética |

agosto 3, 2025

Samuel y Andrónico se acusan de representar el pasado en Bolivia

Los candidatos presidenciales Samuel Doria Medina y Andrónico Rodríguez intercambiaron críticas en redes sociales, acusándose mutuamente de promover modelos