| Avances científicos | Economía |

Podcastle lanza Asyncflow v1.0, texto a voz por IA

TechCrunch

TechCrunch
Podcasting platform Podcastle launches a text-to-speech model with more than 450 AI voices | TechCrunch
Ivan Mehta
https://techcrunch.com/2025/03/03/podcasting-platform-podcastle-launches-a-text-to-speech-model-with-more-than-450-ai-voices/
Publicado el: 1741026282

Podcastle presenta Asyncflow v1.0, un modelo IA de texto a voz que ofrece más de 450 voces y mejora en costos y clonación de voz.

Podcastle se suma a la carrera del texto a voz impulsado por IA

La plataforma de grabación y edición de podcasts, Podcastle, ha lanzado un nuevo modelo de texto a voz llamado Asyncflow v1.0, uniéndose así a otras compañías que utilizan inteligencia artificial para convertir texto en voz. Este innovador modelo permite a los usuarios acceder a más de 450 voces generadas por IA que pueden narrar cualquier texto. Además, Podcastle ofrece una API que permite a los desarrolladores integrar fácilmente esta tecnología en sus aplicaciones.

Ventajas competitivas de Podcastle en costos

Uno de los principales actores detrás de esta innovación es Arto Yeritsyan, fundador de Podcastle. Según Yeritsyan, el nuevo modelo AI está diseñado para minimizar los costes de entrenamiento e inferencia. Esto supone una ventaja competitiva significativa frente a otras startups del sector, como ElevenLabs, Speechify y WellSaid. La empresa logró reducir estos costos gracias a los avances recientes en modelos de lenguaje de gran escala, permitiéndoles desarrollar un modelo de alta calidad con menos datos.

Fondos y precios

El desarrollo de Asyncflow v1.0 ha sido posible en parte gracias a una ronda de financiación Serie A que recaudó 13,5 millones de dólares el año pasado. En cuanto a los costos para los usuarios, Podcastle ofrece el servicio de conversión de texto a voz por alrededor de 40 dólares por 500 minutos, lo que es casi la mitad del precio de su competidor ElevenLabs.

Innovaciones en clonación de voz

Otro avance significativo es la mejora en su función de clonación de voz. Anteriormente, los usuarios necesitaban leer aproximadamente 70 oraciones para entrenar el sistema, pero ahora solo se requiere unos pocos segundos de grabación para crear un clon de la voz. Esta mejora utiliza la tecnología Magic Dust AI de Podcastle, lanzada el año pasado, que aumenta la calidad del audio. Aunque las voces generadas todavía pueden sonar algo robóticas, Podcastle está trabajando en perfeccionar esta característica con el tiempo.

Evolución y futuro de la plataforma

Además de los avances en texto a voz, Podcastle busca ofrecer una gama de herramientas en un sitio rediseñado que incluye capacidades para audio, video, podcasts y narraciones impulsadas por IA. Yeritsyan comenta que, aunque la mayoría de los usuarios emplean la plataforma principalmente para contenido de audio, la demanda de video está creciendo rápidamente. Con estas innovaciones, Podcastle espera posicionarse como un líder integral en el ámbito de creación de contenido potenciado por inteligencia artificial.

Post Views: 25

Instantáneas