Generar apenas nueve imágenes por IA sale caro. Tanto como recargar por completo tu móvil
La revolución de la IA no está saliendo barata. A los ingentes recursos de computación que necesitan los modelos de IA generativa se les une una realidad incómoda: esos procesos de entrenamiento y el propio uso de dichos modelos provoca emisiones de CO2 importantes. Ya sabíamos que ChatGPT y Bard contaminaban, pero es que los Midjourney y DALL-E 2 del mundo contaminan aún más.
El estudio. Una investigación llevada a cabo por investigadores de la Universidad de Carnegie Mellon y la startup HuggingFace revela que usar los modelos de IA generativa requiere ingentes cantidades de energía. En el estudiohttps://arxiv.org/abs/2311.16863 revelaron el uso de una herramienta llamada Code Carbon para comparar las emisiones de CO2 en los 16 modelos más populares usados en el HuggingFace Hub, una plataforma abierta que permite probar y usar esos modelos fácilmente.
ChatGPT consume, pero DALL-E consume mucho más. En las conclusiones quedó claro que los modelos de IA generativa de texto —chatbots similares a ChatGPT— consumían mucha energía, pero la cosa era especialmente preocupante en el caso de los modelos dedicados a la generación de imágenes.
Comparando consumos. En las pruebas realizadas la generación de 1.000 inferencias suponía consumos que iban entre los 0,06 y los 2,9 kWh, siendo el consumo medio de 1,35 kWh. Los investigadores luego destacaban cómo de media un smartphone consume 0,012 kWh de energía para cargarse. ¿Qué significa eso?
Cargar el móvil da para nueve imágenes. Con esas cifras, el estudio concluía que generar nueve imágenes con estos modelos de IA consume lo mismo que cargar el móvil completamente. Ese dato pone en perspectiva el problema, porque lo normal en estos procesos de uso de IA generativa de imágenes es generar a menudo unas cuantas imágenes hasta que damos con la que buscamos.
Y hay modelos terriblemente ineficientes. Aunque la media era esa, hay modelos especialmente glotones de energía, y según el estudio el peor de todos ellos consume 11,49 kWh por 1.000 inferencias, lo que hace que básicamente cada imagen costara energéticamente lo mismo que recargar una vez el móvil.
¿Y las emisiones? De nuevo el problema de fondo es también el de las emisiones de CO2, que son notables: de media cada imagen producida genera entre 0,1 y 0,5 gramos de dióxido de carbono. En los modelos más contaminantes del estudio la cifra fue escandalosa, y cada imagen provocaba unas emisiones de 2 gramos de CO2.
No es exhaustivo, pero da pistas. Los propios responsables del estudio destacaban que los debates sobre consumo energético y emisiones se centran en la fase de entrenamiento, pero deberían tener (muy) en cuenta la fase de uso posterior. Esperan que estos datos sirvan —aun reconociendo que no son exhaustivos— para poner en marcha medidas, buenas prácticas y regulación que ayuden a mitigar el problema.
Imagen | Lasse Jensen
En Xataka | «Make it more»: la última moda en ChatGPT es pedirle imágenes cada vez más exageradas y surrealistas