L’essor fulgurant de l’intelligence artificielle générative s’accompagne d’une empreinte environnementale croissante. Pourtant, peu d’études indépendantes mesurent ces impacts avec précision. Pour combler ce manque, l’ADEME a soutenu la première analyse de cycle de vie (ACV) d’un grand modèle de langage européen, Mistral Large 2, réalisée par le cabinet Carbone 4. Mathieu Wellhoff, chef de service sobriété numérique à l’ADEME, revient sur les résultats et les enseignements de ce travail pionnier.
Partager
Nous connaissions déjà les impacts environnementaux du numérique. L’essor de l’IA générative a rendu ces enjeux encore plus pressants, d’autant que les principaux acteurs manquent de transparence. Les rares études existantes reposaient souvent sur des estimations ou couvraient un périmètre limité. L’ACV s’imposait donc comme l’outil le plus pertinent : elle permet une évaluation complète des impacts, depuis la fabrication des équipements jusqu’à leur fin de vie, en passant par l’entraînement des modèles et leur utilisation.
L’étude a été confiée au cabinet Carbone 4. L’ADEME l’a financée et accompagnée, en apportant son expertise lors du cadrage et du suivi du projet. Les consultants de Carbone 4 ont travaillé étroitement avec les ingénieurs de Mistral AI afin de collecter toutes les données nécessaires : nombre de puces utilisées, consommation énergétique, localisation des centres de données… Cette démarche a permis d’évaluer l’empreinte du modèle Mistral Large 2 selon trois critères : émissions de gaz à effet de serre, consommation de métaux et empreinte en eau. Nous avons ainsi étudié le modèle Mistral Large 2 sur l’ensemble de son cycle de vie, jusqu’en janvier 2025.
Il s’agit d’une ACV complète et multicritères, qui intègre la consommation liée aux entraînements du modèle mais aussi celle générée par les requêtes des utilisateurs. Deux indicateurs clés émergent : l’empreinte globale de l’entraînement et le coût d’une requête équivalente à une page de texte, sans prise en compte de l’entraînement. À titre d’exemple, l’entraînement du modèle Large 2 a émis environ 20 000 tonnes de CO₂eq, soit l’équivalent de l’empreinte annuelle de plus de 2 000 personnes en France. Cette étude a également fait l’objet d’une revue critique, réalisée par deux cabinets spécialisés (Resilio et Hubblo), qui est un gage de fiabilité essentiel pour communiquer des résultats. Il est à noter que d’autres chiffres communiqués récemment (Google, Open AI) n’ont pas fait l’objet d’une telle revue par les pairs.
Oui, notamment concernant ce qu’on appelle l’allocation de la phase d’entraînement à l’usage des modèles. Idéalement, lorsqu’on calcule l’impact d’une requête, on doit prendre l’ensemble des impacts qui ont abouti à cette requête, notamment ceux liés à l’entraînement. On doit alors définir un « facteur d’allocation » : par exemple, s’il y a 100 requêtes au total sur la durée de vie du modèle, il faut allouer 1/100ᵉ de l’empreinte de l’entraînement à chaque requête. Mais cela se complexifie lorsqu’on étudie un modèle encore en usage, comment répartir son empreinte sur chaque requête, sans connaître le nombre total de requêtes que ce modèle traitera ? C’est pourquoi nous avons choisi de présenter deux résultats distincts : d’une part l’empreinte totale de l’entraînement, d’autre part le coût d’une requête utilisateur, sans prise en compte de l’entraînement.
La localisation des centres de données est déterminante : utiliser un mix électrique faiblement carboné, comme en France, peut réduire fortement l’empreinte carbone. L’éco-conception des modèles joue également un rôle majeur. Du côté des usagers, de bonnes pratiques doivent être adoptées : formuler clairement sa requête pour éviter les répétitions, choisir un modèle adapté à la complexité de la tâche (une simple traduction français-anglais ne requiert pas le modèle le plus puissant, un modèle de petite taille moins consommateur sera largement suffisant ! ), ou encore demander des réponses courtes. Pour cela, il paraît important de former les usagers à une bonne utilisation des IA afin d’être plus efficace dans l’usage qu’on en fait. Enfin, il est essentiel d’intégrer une logique de sobriété, c’est-à-dire se demander en amont si l’usage est réellement nécessaire. Différentes ressources existent pour aider les entreprises à réduire leur impact : le référentiel général d’IA Frugale ainsi que le kit d’engagement pour une IA Frugale de l’écolab, ou encore le Référentiel Général d’Ecoconception des Services Numériques, qui comporte une partie algorithmie.
Oui, à condition de développer des méthodologies standardisées. Le référentiel général d’IA Frugale va dans ce sens, en proposant une méthodologie ACV intégrant tous les impacts. Des indicateurs fiables et comparables pourraient pousser les utilisateurs à privilégier les modèles les plus responsables et inciter les concepteurs à réduire leur empreinte.