...
...
LA RECETA PARA UNA IA MAS VERDE

LA RECETA PARA UNA IA MAS VERDE

El desarrollo de modelos de IA es un culpable climático que se pasa por alto. Los informáticos han creado un libro de recetas para diseñar modelos de IA que utilicen mucha menos energía sin comprometer su rendimiento.

♻ Ecología 17/04/2024
2 0 0 7

J
@JCampo

Las han llegado con fuerza listas para cambiar nuestro mundo en un sin número de aspectos, desde la salud hasta la ecología y pasando por el entrenamiento; pero esta moneda tiene una cara que no se suele ver y es el impacto negativo sobre el medio ambiente que tiene estas tecnologías. Preocupados al respectó hay alrededor del mundo varios grupos de científicos que buscan soluciones, uno de ellos es un grupo de investigación conformado por científicos informáticos de la Universidad de Copenhague han creado un libro de recetas para diseñar modelos de IA que utilizan mucha menos energía sin comprometer el rendimiento. Argumentan que el consumo de energía y la huella de carbono de un modelo deberían ser un criterio fijo al diseñar y entrenar modelos de IA.

El hecho de que se necesitan cantidades colosales de energía para buscar en Google, hablar con Siri, pedirle a ChatGPT que haga algo o usar IA en cualquier sentido, se ha vuelto gradualmente de conocimiento común. Un estudio estima que para 2027 los servidores de IA consumirán tanta energía como Argentina o Suecia. De hecho, se estima que un solo mensaje ChatGPT consume, en promedio, tanta energía como cuarenta cargas de teléfonos móviles. Pero la comunidad investigadora y la industria aún tienen que centrarse en el desarrollo de modelos de IA que sean energéticamente eficientes y, por tanto, más respetuosos con el clima, señalan investigadores en informática de la Universidad de Copenhague.

Estimaciones  prevé que para el 2025 el sector de las IA consuma el 20% de la electricidad producida en todo el mundo y sea responsable del 5,5% de las emisiones totales de carbono.

"Hoy en día, los desarrolladores se centran exclusivamente en construir modelos de IA que sean eficaces en términos de precisión de sus resultados. Es como decir que un coche es eficaz porque te lleva a tu destino rápidamente, sin tener en cuenta la cantidad de combustible que utiliza. Como resultado, los modelos de IA suelen ser ineficientes en términos de consumo de energía", afirma el profesor asistente Raghavendra Selvan del Departamento de Ciencias de la Computación, cuya investigación analiza las posibilidades de reducir la huella de carbono de la IA.

Pero el nuevo estudio, del que él y el estudiante de informática Pedram Bakhtiarifard son dos de los autores, demuestra que es fácil frenar una gran cantidad de CO 2 e sin comprometer la precisión de un modelo de IA. Para ello es necesario tener en cuenta los costos climáticos desde las fases de diseño y entrenamiento de los modelos de IA.

El impacto ambiental de las AI

La explosión del uso de Machine Learning (aprendizaje automático), y más concretamente los modelos basados en aprendizaje profundo están aumentando los consumos de energía y la huella de carbono de la industria en la nube. “El problema es que los grandes modelos de lenguaje que se están utilizando ahora necesitan enormes cantidades de datos, y no se puede entrenar en una única máquina (local) porque necesitarías una memoria brutal”, explica Amparo Alonso, investigadora en IA de la Universidad de La Coruña. Según la investigadora, no sólo es cosa de la nube, el problema del consumo energético del aprendizaje también tiene que ver con las grandes cantidades de datos que necesitan. “Utilizan datos muy complejos, textos muy grandes y también tienen que afinar muchos parámetros”, explica.

 Por ejemplo las emisiones para el entrenamiento de GPT-3 fueron de 552 toneladas de CO2 y su consumo de energía fue de 1287 MWh, según un artículo científico escrito por autores de Google y de la Universidad de Berkeley. Esto es equivalente al consumo medio de un hogar estadounidense durante 120 años.

En su estudio, los investigadores de la Universidad de Copenhague calcularon cuánta energía se necesita para entrenar más de 400.000 modelos de IA de tipo red neuronal convolucional ; esto se hizo sin entrenar todos estos modelos. Entre otras cosas, las redes neuronales convolucionales se utilizan para analizar imágenes médicas, para la traducción de idiomas y para el reconocimiento de objetos y rostros, una función que quizás conozcas desde la aplicación de la cámara de tu teléfono inteligente.

Libro de recetas para la industria de la IA

Basándose en los cálculos, los investigadores presentan una colección de referencia de modelos de IA que utilizan menos energía para resolver una tarea determinada, pero que funcionan aproximadamente al mismo nivel. El estudio muestra que al optar por otro tipo de modelos o ajustar los modelos, se puede lograr un ahorro de energía del 70-80% durante la fase de capacitación e implementación, con solo una disminución del rendimiento del 1% o menos. Y según los investigadores, esta es una estimación conservadora.

"Considere nuestros resultados como un libro de recetas para los profesionales de la IA. Las recetas no solo describen el rendimiento de diferentes algoritmos, sino también su eficiencia energética. Y al intercambiar un ingrediente con otro en el diseño de un modelo, se puede "A menudo logran el mismo resultado, por lo que ahora los profesionales pueden elegir el modelo que desean basándose tanto en el rendimiento como en el consumo de energía, y sin necesidad de entrenar cada modelo primero", afirma Pedram Bakhtiarifard, quien continúa:

"A menudo, se entrenan muchos modelos antes de encontrar el que se sospecha que es el más adecuado para resolver una tarea particular. Esto hace que el desarrollo de la IA consuma mucha energía. Por lo tanto, sería más respetuoso con el clima elegir el modelo correcto desde el principio, eligiendo uno que no consuma demasiada energía durante la fase de entrenamiento".

Los investigadores subrayan que en algunos campos, como los vehículos autónomos o determinadas áreas de la medicina, la precisión del modelo puede ser fundamental para la seguridad. Aquí es importante no comprometer el rendimiento. Sin embargo, esto no debería ser un impedimento para luchar por una alta eficiencia energética en otros ámbitos.

"La IA tiene un potencial asombroso. Pero si queremos garantizar un desarrollo sostenible y responsable de la IA, necesitamos un enfoque más holístico que no sólo tenga en mente el rendimiento del modelo, sino también el impacto climático. Aquí, demostramos que es posible encontrar una mejor Cuando se desarrollan modelos de IA para diferentes tareas, la eficiencia energética debería ser un criterio fijo, tal como es estándar en muchas otras industrias", concluye Raghavendra Selvan.

Los centros de datos son enormes instalaciones que requieren ingentes cantidades de energía, y grandes volúmenes de agua para su refrigeración. — Nikada/iStock

Según un estudio de la University of Massachusetts Amherstrealizado en 2023, entrenar un modelo de IA puede emitir hasta 626 mil toneladas de CO2, lo que equivale a la huella ecológica de cinco coches durante toda su vida útil. En este mismo artículo los investigadores hicieron una analogía entre la industria de la inteligencia artificial y la industria del petróleo, ya que, de manera similar al proceso de extracción y refinamiento del combustible fósil, los datos extraídos se convierten en un producto altamente rentable. Ahora, esta analogía parece extenderse aún más, ya que al igual que el petróleo, el aprendizaje profundo tiene un impacto ambiental considerable.

El "libro de recetas" elaborado en este trabajo está disponible como un conjunto de datos de código abierto para que otros investigadores experimenten. La información sobre todas estas 423.000 arquitecturas se publica en Github, a la que los profesionales de la IA pueden acceder mediante simples scripts de Python.

Los investigadores de la UCPH estimaron cuánta energía se necesita para entrenar 429.000 de los modelos de subtipo de IA conocidos como redes neuronales convolucionales en este conjunto de datos. Estos se utilizan, entre otras cosas, para la detección de objetos, la traducción de idiomas y el análisis de imágenes médicas.

Se estima que sólo el entrenamiento de las 429.000 redes neuronales analizadas en el estudio requeriría 263.000 kWh. Esto equivale a la cantidad de energía que consume un ciudadano danés medio durante 46 años. Y a una computadora le llevaría unos 100 años realizar el entrenamiento. En realidad, los autores de este trabajo no entrenaron estos modelos ellos mismos, sino que los estimaron utilizando otro modelo de IA, ahorrando así el 99% de la energía que habría requerido.

Mucho expertos señalan que solo es cuestión de tiempo que la inteligencia artificial se convierta en un problema de alta magnitud en cuanto a su impacto ecológico

Entrenar modelos de IA consume mucha energía y, por lo tanto, emite mucho CO2e. Esto se debe a los cálculos intensivos que se realizan durante el entrenamiento de un modelo, que normalmente se ejecutan en computadoras potentes. Esto es especialmente cierto para modelos grandes, como el modelo de lenguaje detrás de ChatGPT. Las tareas de IA a menudo se procesan en centros de datos, que exigen cantidades significativas de energía para mantener las computadoras en funcionamiento y refrigeradas. La fuente de energía de estos centros, que pueden depender de combustibles fósiles, influye en su huella de carbono.

Así las IA se revelan ante el hombre como una paradoja, por un lado son una herramienta que merced a sus capacidades para gestionar recursos de manera eficiente y mejorar la sostenibilidad urbana nos ofrece herramientas poderosas para abordar los desafíos medio ambientales actuales y remodelar nuestro impacto en el mundo que habitamos. Pero por otro lado huella ambiental de la IA, principalmente por emisiones de CO2  ocasionadas por su muy significativa demanda de electricidad, nos recuerda la urgencia de equilibrar la innovación con la responsabilidad ambiental.

 

"Si se crea un modelo que es energéticamente eficiente desde el principio, se reduce la huella de carbono en cada fase del 'ciclo de vida' del modelo. Esto se aplica tanto al entrenamiento del modelo, que es un proceso particularmente intensivo en energía que suele tardar semanas o meses, así como su aplicación", afirma Selvan.

Según un estudio de la University of Massachusetts Amherstrealizado en 2023, entrenar un modelo de IA puede emitir hasta 626 mil toneladas de CO2, lo que equivale a la huella ecológica de cinco coches durante toda su vida útil. En este mismo artículo los investigadores hicieron una analogía entre la industria de la inteligencia artificial y la industria del petróleo, ya que, de manera similar al proceso de extracción y refinamiento del combustible fósil, los datos extraídos se convierten en un producto altamente rentable. Ahora, esta analogía parece extenderse aún más, ya que al igual que el petróleo, el aprendizaje profundo tiene un impacto ambiental considerable.

El "libro de recetas" elaborado en este trabajo está disponible como un conjunto de datos de código abierto para que otros investigadores experimenten. La información sobre todas estas 423.000 arquitecturas se publica en Github, a la que los profesionales de la IA pueden acceder mediante simples scripts de Python.

Los investigadores de la UCPH estimaron cuánta energía se necesita para entrenar 429.000 de los modelos de subtipo de IA conocidos como redes neuronales convolucionales en este conjunto de datos. Estos se utilizan, entre otras cosas, para la detección de objetos, la traducción de idiomas y el análisis de imágenes médicas.

Se estima que sólo el entrenamiento de las 429.000 redes neuronales analizadas en el estudio requeriría 263.000 kWh. Esto equivale a la cantidad de energía que consume un ciudadano danés medio durante 46 años. Y a una computadora le llevaría unos 100 años realizar el entrenamiento. En realidad, los autores de este trabajo no entrenaron estos modelos ellos mismos, sino que los estimaron utilizando otro modelo de IA, ahorrando así el 99% de la energía que habría requerido.

Entrenar modelos de IA consume mucha energía y, por lo tanto, emite mucho CO2e. Esto se debe a los cálculos intensivos que se realizan durante el entrenamiento de un modelo, que normalmente se ejecutan en computadoras potentes. Esto es especialmente cierto para modelos grandes, como el modelo de lenguaje detrás de ChatGPT. Las tareas de IA a menudo se procesan en centros de datos, que exigen cantidades significativas de energía para mantener las computadoras en funcionamiento y refrigeradas. La fuente de energía de estos centros, que pueden depender de combustibles fósiles, influye en su huella de carbono.

Así las IA se revelan ante el hombre como una paradoja, por un lado son una herramienta que merced a sus capacidades para gestionar recursos de manera eficiente y mejorar la sostenibilidad urbana nos ofrece herramientas poderosas para abordar los desafíos medio ambientales actuales y remodelar nuestro impacto en el mundo que habitamos. Pero por otro lado huella ambiental de la IA, principalmente por emisiones de CO2  ocasionadas por su muy significativa demanda de electricidad, nos recuerda la urgencia de equilibrar la innovación con la responsabilidad ambiental.

Otros artículos del autor

Conversación

...
...