Inteligencia artificial e internet, ¿una combinación explosiva?

02 OCT 2023

El entrenamiento con datos generados por versiones anteriores puede conducir a que un modelo más avanzado ofrezca resultados absurdos

También te puede interesar:

Ejemplo de la degeneración en las sucesivas versiones de la inteligencia artificial entrenada con otras inteligencias artificiales

La inteligencia artificial generativa, capaz de crear contenidos originales a partir de datos existentes, está experimentando un éxito espectacular. Millones de personas se valen de ella para generar imágenes, texto o música. En los próximos años, de seguir la tendencia, el contenido producido de este modo puede llegar a ser mayoritario en internet. Esto plantea una situación problemática, ya que las herramientas de inteligencia artificial generativa se entrenan en muchos casos con grandes conjuntos de datos extraídos de internet. Por tanto, en breve, modelos como el popular ChatGPT estarán adiestrando sus nuevas versiones con datos creados por las anteriores que pueden contener errores.

En un estudio titulado Towards Understanding the Interplay of Generative Artificial Intelligence and the Internet, han explorado el efecto de la mencionada retroalimentación en modelos sencillos de inteligencia artificial para la generación de imágenes, como Stable Diffusion o DALL-E. Su conclusión es que, a medida que nuevas versiones trabajan con datos generados por las precedentes, la calidad y la diversidad de las imágenes obtenidas se reduce de manera drástica.

Los investigadores observaron que un modelo de difusión simple entrenando con una categoría específica de imágenes, como fotografías de pájaros y flores, producía resultados inutilizables al cabo de varias generaciones. La solución podría parecer tan sencilla como descartar los datos previos generados por inteligencia artificial. De hecho, existen métodos para hacerlo, “pero el lanzamiento diario de nuevos modelos los vuelve rápidamente obsoletos”, aclara Reviriego, quien forma parte en la UPM del grupo de investigación Internet de Nueva Generación.

El profesor de la ETSIT, La Escuela Técnica Superior de Ingenieros de Telecomunicación, afirma que los resultados del estudio -que se presentó en el congreso anual de la Association for Uncertainty in Artificial Intelligence celebrado en agosto en la Universidad Carnegie Mellon (EEUU)- coinciden con los de investigadores de otras universidades sobre modelos de generación de texto. “Estos resultados iniciales sugieren que la interacción entre modelos de inteligencia artificial generativa e internet pueden tener efectos indeseados y abren una línea de investigación de alto interés tanto a nivel teórico como por sus potenciales implicaciones en la sociedad”, explica.

Imprimir Subir