Pourquoi l’intelligence artificielle est un désastre écologique
Le numérique pollue, et l’IA tout particulièrement. Entraîner un modèle de deep learning pour traitement du langage naturel émet autant qu’un être humain pendant 57 ans, ou que 5 voitures pendant leur durée de vie. Une seule solution : la sobriété.
A quand une taxe carbone pour les géants de la tech ? Selon des chercheurs de l’Université du Massachusetts, aux Etats-Unis, l’IA ne fait pas que « raffiner » des données comme l’on raffinerait du pétrole : tout comme l’or noir, les méthodes d’apprentissage en profondeur ont en effet un impact environnemental considérable.
Les scientifiques américains ont mesuré l’empreinte carbone d’une branche de l’IA qui explose, au fur et à mesure que les assistants vocaux et les services de traduction instantanée se développent : le traitement automatique du langage naturel (NLP). Vous n’en avez sans doute pas conscience, mais pour interpréter une commande vocale adressée à Google Assistant et pour lui apprendre à reconnaître votre voix, pour interpréter des textes complexes, ou encore pour traduire un document, il faut une énorme quantité d’énergie – car il faut entraîner en profondeur les algorithmes à partir d’une grande masse de données, et cela des centaines, voire des milliers de fois, pendant des semaines ou des mois, via des ordinateurs surpuissants.
« Les progrès récents en matière de matériel et de méthodologie pour la formation des réseaux neuronaux ont donné naissance à une nouvelle génération de grands réseaux formés à l’abondance de données. Ces modèles de deep learning ont permis d’obtenir des gains notables en termes de précision pour de nombreuses tâches du NLP. Toutefois, ces améliorations dépendent de la disponibilité de ressources informatiques exceptionnellement importantes, qui nécessitent une consommation d’énergie tout aussi importante », indiquent les chercheurs.
Pour faire circuler et stocker cette masse de données, il faut aussi des milliers de centres de calcul et de fermes de serveurs, les data centers, qui tournent à plein régime, et qui génèrent 2 à 5 % des émissions mondiales de gaz à effet de serre. Ces usines numériques, extrêmement énergivores et nécessitant un refroidissement constant, sont encore nombreuses à fonctionner grâce à de l’électricité produite à partir de charbon ou de centrales nucléaires. « En conséquence, ces modèles sont coûteux à former et à développer, tant sur le plan financier, en raison du coût du matériel et de l’électricité ou du temps de calcul dans les nuages, que sur le plan environnemental, en raison de l’empreinte carbone nécessaire pour alimenter le matériel moderne de traitement des algorithmes », écrivent les scientifiques de l’Université du Massachusetts dans leur étude.
La colossale empreinte écologique du deep learning
Concrètement, les chercheurs ont étudié le cycle de vie de plusieurs modèles d’entrainement d’IA, parmi les plus populaires (le « Transformer model », ELMo, BERT, l’ORET, le GPT-2…). Ils les ont entraîné à partir d’une masse considérable de données, sur un seul microcesseur, pendant une journée, afin de calculer la quantité d’énergie requise, puis ont multiplié les résultats par le nombre d’heures et de microprocesseurs utilisés dans le cadre des recherches en IA. Ils ont ainsi pu estimer ce que consomment les méthodes de deep learning, en équivalent CO2, sur la base du mix énergétique moyen aux USA (17 % d’énergies renouvelables, 35 % de gaz, 27 % de charbon, et 19 % de nucléaire).
Selon leurs recherches, alors qu’un voyage en avion New-York – San Francisco pour une personne consomme l’équivalent d’une tonne de CO2 (1984 livres), certains modèles d’entraînement d’algorithmes par essai-erreur ont généré, en quelques jours, entre 78 468 et 626 155 livres d’équivalent CO2. Pour référence, un humain moyen génère 11 023 livres d’équivalent CO2 pendant une année. Et une voiture, dans le même laps de temps, génère 126 000 livres d’équivalent CO2. Autrement dit, entraîner un modèle de deep learning pendant 4 à 7 jours émet donc autant qu’un être humain pendant 57 ans, ou que 5 voitures pendant leur durée de vie.
Ces chiffres sont déjà énormes, mais leur importance l’est encore plus quand l’on considère que les recherches dans ce domaine ne sont pas près de s’arrêter, et donc d’utiliser toujours plus de données et d’énergie, dans un contexte de course à l’IA. Ainsi, selon un expert en IA interrogé par le MIT Technology Review, « en général, la plupart des dernières recherches en intelligence artificielle négligent l’efficacité, car de très grands réseaux neuronaux se sont révélés utiles pour une variété de tâches, et les entreprises et les institutions qui ont un accès abondant aux ressources informatiques peuvent en tirer parti pour obtenir un avantage concurrentiel ».
Éteindre les ordis pour sauver la planète
Cette étude est en phase avec une autre analyse publiée récemment par The Shift Project, qui estime que l’empreinte énergétique de l’industrie du numérique augmente de 10 % par an. Dans son rapport, intitulé « pour une sobriété numérique », l’ONG française explique que « la part du numérique dans les émissions de gaz à effet de serre a augmenté de moitié depuis 2013, passant de 2,5 % à 3,7 % du total des émissions mondiales », et que les émissions de CO2 du numérique ont augmenté dans le même temps d’environ 450 millions de tonnes dans l’OCDE, dont les émissions globales ont en même temps diminué de 250 millions de tonnes. Ainsi, alors que l’intensité énergétique (le rapport de la consommation d’énergie au PIB) de l’économie en général a tendance à s’améliorer, celle du numérique s’aggrave – dans le monde en général, elle baisse de 2% par an, mais dans le numérique, elle augmente de 4 % par an…
L’urgence est là. Comme l’explique The Shift Project à propos de l’économie numérique, « les impacts environnementaux directs et indirects liés aux usages croissants du numérique sont systématiquement sous-estimés, compte tenu de la miniaturisation des équipements et de ‘l’invisibilité’ des infrastructures utilisées ». Dans le même temps, observe le rapport, les processus de transition énergétique et numérique « ne sont que très rarement coordonnés au sein d’une même approche systémique ». Et de noter que « le risque de voir se réaliser un scénario dans lequel des investissements de plus en plus massifs dans le Numérique aboutiraient à une augmentation nette de l’empreinte environnementale des secteurs numérisés est bien réel ».
Selon The Shift Project, si les recherches en IA et l’industrie du numérique (avec la consommation de films en streaming, en particulier) continuent à ce rythme, le climat devrait à terme être « déréglé pour de bon ». Finirons-nous donc par éteindre les ordis pour sauver la planète ?
Vers une sobriété des algorithmes ?
Mais ne perdons pas espoir. Depuis 5 ou 6 ans déjà, les GAFA essaient de rendre leurs propres installations plus « vertes ». Brocardés ces dernières années par Greenpeace, les géants de la tech (Google, Apple, etc.) font en effet en sorte, de plus en plus, d’alimenter leurs data centers à partir d’énergies renouvelables. Toutefois, rendre les centres de données vertes ne changera évidemment pas le problème de la voracité en données des chercheurs…
Selon les scientifiques de l’Université du Massachusetts, les chercheurs en IA ont de leur côté tout intérêt à calculer pour de bon le coût environnemental des modèles qu’ils utilisent pour l’apprentissage de leurs algorithmes, mais aussi essayer d’utiliser des programmes moins gourmands en données et en énergie. « Nous recommandons un effort concerté de la part de l’industrie et du milieu universitaire pour promouvoir la recherche d’algorithmes plus efficaces sur le plan informatique, ainsi que de matériel et de logiciels qui nécessitent moins d’énergie », indiquent-ils. Pour réduire l’énergie produite par les modèles de deep learning, ils recommandent notamment aux développeurs de logiciels d’apprentissage machine d’utiliser des techniques permettant d’économiser du calcul, comme l’optimisation bayésienne et l’optimisation aléatoire. A eux de jouer, donc…
very good content, i love it
It is perfect time to make some plans for the future and it’s time to be happy. I have read this post and if I could I want to suggest you few interesting things or tips. Maybe you can write next articles referring to this article. I desire to read even more things about it!