Elon Musk y el Fin de los Datos Reales para Entrenar IA

Elon Musk advierte sobre la escasez de datos reales para entrenar modelos de IA, empujando hacia el uso de datos sintéticos. Grandes tecnológicas ya adoptan esta alternativa con miras a un aprendizaje más autónomo.
Lorem Ipsum
Retrato de un hombre con expresión reflexiva y fondo desenfocado.
Hombre de mediana edad con expresión pensativa.

Elon Musk y el Fin de los Datos Reales para Entrenar IA

Elon Musk, el conocido empresario y dueño de la empresa de inteligencia artificial xAI, ha confirmado una inquietante tendencia en el desarrollo de la inteligencia artificial: la falta de datos reales para entrenar nuevos modelos. Durante una conversación transmitida en vivo con Mark Penn, presidente de Stagwell, Musk afirmó que hemos agotado prácticamente todo el conocimiento humano acumulado para el entrenamiento de IA. Según Musk, este punto crítico se alcanzó el año pasado.

El Uso de Datos Sintéticos como Alternativa

Ante la escasez de datos reales, la solución planteada por Musk y otros expertos es el uso de datos sintéticos. Estos datos son generados por los propios modelos de IA y representan una nueva forma de alimentar el aprendizaje de las máquinas. Musk explica que con los datos sintéticos, la IA puede autoevaluarse y aprender por sí misma, abriendo una puerta hacia un tipo de aprendizaje más autónomo.

Adopción de Datos Sintéticos por las Grandes Tecnológicas

Grandes compañías tecnológicas como Microsoft, Meta, OpenAI, y Anthropic ya están utilizando datos sintéticos para entrenar sus modelos insignia de IA. Según un informe de Gartner, se estima que el 60% de los datos usados para proyectos de IA y análisis en 2024 serán generados sintéticamente. Esta tendencia también se refleja en modelos como Phi-4 de Microsoft y Gemma de Google, que combinan datos reales y sintéticos para mejorar su funcionalidad.

Ventajas y Desventajas del Entrenamiento con Datos Sintéticos

El entrenamiento de modelos de IA con datos sintéticos ofrece algunas ventajas, como la reducción de costos. Por ejemplo, la startup de IA Writer afirma que desarrollar su modelo Palmyra X 004 utilizando casi exclusivamente fuentes sintéticas costó solo $700,000, mucho menos que el coste estimado de desarrollar un modelo comparable de OpenAI. Sin embargo, también existen desventajas, como el riesgo de que los modelos se vuelvan menos creativos y más sesgados, comprometiendo así su funcionalidad.

Preocupaciones sobre el Colapso de Modelos

Un posible riesgo asociado al uso de datos sintéticos es el colapso de modelos, donde un modelo pierde creatividad y se vuelve sesgado debido a las limitaciones inherentes de los datos que lo entrenan. Al depender de datos generados artificialmente, cualquier sesgo o limitación presente en estos datos se reflejará en los resultados de los modelos, generando salidas no deseadas. Por tanto, es crucial que los datos sintéticos se manejen con precaución para evitar comprometer la calidad y funcionalidad de los modelos de IA.

Estados Unidos retira a Colombia certificación como aliado en lucha antidrogas

EE.UU. retira a Colombia la certificación como aliado antidrogas por récord en cultivos de coca, restringiendo ayuda de 380
Soldados colombianos patrullan la localidad de El Carmelo tras un ataque atribuido a disidentes de las FARC. / AP / AFP

León XIV ofrece su «mea culpa» por abusos y expulsa a un cura pedófilo

El Papa León XIV expulsa a un diácono condenado por abusos a menores y ofrece un histórico «mea culpa»
El Papa saluda a una joven en silla de ruedas durante el Jubileo de la Consolación. / ANSA / Clarín

Diputados agendan leyes sobre hidrocarburos y vocales del TSE

La Cámara Baja analiza 42 proyectos, incluyendo la reactivación de hidrocarburos con capital privado y el plazo para designar
La Cámara de Diputados en una de sus últimas sesiones / Archivo / Correo del Sur

Trump comenta sobre Redford, TikTok y ofensiva israelí antes de viaje al Reino Unido

Trump aborda TikTok, el conflicto en Gaza, un ataque naval y su viaje al Reino Unido en declaraciones previas
Donald Trump y Melania Trump abandonan la Casa Blanca / EFE / Clarín

Roberto Navia participa en conversatorio sobre periodismo investigativo en Unifranz

El periodista boliviano Roberto Navia dialogará con estudiantes sobre su especialidad en periodismo investigativo en la Universidad Franz Tamayo.
Roberto Navia durante un evento periodístico / Información de autor no disponible / EL DEBER

Tuto Quiroga desafía a Evo Morales a admitir su apoyo al binomio Paz-Lara

Jorge ‘Tuto’ Quiroga reta públicamente a Evo Morales a transparentar su voto por el binomio del PDC en la
Tuto Quiroga muestra declaraciones de su rival, Rodrigo Paz. / Captura de video / Diario Correo del Sur

Trump demanda a The New York Times por 15.000 millones de dólares por difamación

Trump demanda a The New York Times y Penguin Random House reclamando 15.000 millones por artículos y un libro
El edificio de The New York Times / AP /Mary Altaffer / Clarín

Controlan incendio que afectó más de 500 hectáreas en área protegida Ñembi Guasu

Bomberos controlan un gran incendio en la reserva Ñembi Guasu de Bolivia, que ha calcinado más de 500 hectáreas
Dibujo de un televisor antiguo con el texto 'IMAGEN NO DISPONIBLE'.

informe de la onu confirma genocidio israelí en gaza y señala a netanyahu

Un informe de la ONU confirma que Israel cometió genocidio en Gaza y apunta a sus máximos líderes, instando
manifestante muestra a un niño palestino desnutrido en una marcha en seúl / efe / clarín

Incendios forestales en Santa Cruz superan las 100.000 hectáreas afectadas

Más de 100.000 hectáreas consumidas por incendios activos en Santa Cruz, con seis municipios declarados en desastre y emergencia.
Brigadas planificando tareas antes de ingresar a combatir las llamas / Información de autor no disponible / EL DEBER

La Unión Europea anuncia sanciones contra Israel por la ofensiva en Gaza

La UE anuncia suspensión de acuerdos comerciales contra Israel por su operación militar en Gaza, agravando la crisis humanitaria.
Familias palestinas huyen desde la Ciudad de Gaza hacia el sur del enclave / REUTERS / Clarín

JP Velasco critica al binomio del PDC en TikTok y los tilda de irresponsables

El vicepresidencial de Libre denuncia irresponsabilidad y 23 casos judiciales abiertos contra los candidatos del PDC por sus polémicas
Live de JP Velasco en TikTok / Erbol / Diario Correo del Sur