• Contact
  • Abonnez-vous
  • Contribuez
Panier / 0,00 €

Votre panier est vide.

Lire Le dernier numéroLe dernier numéro
Revue Politique et Parlementaire
  • Se connecter
S'abonner
  • Politique
  • International
  • Economie
  • Culture
  • Société
  • Science et technologie
  • La cité des débats
    • Faut-il avoir peur de l’avenir ?
    • Aimons-nous encore la liberté ?
    • Savoir, pouvoir et démocratie
    • S’engager au 21ème Siècle
  • Le printemps des techno
    • Edition 2023
    • Edition 2024
    • Edition 2025
  • Boutique
    • Les numéros
    • Abonnement
Aucun résultat
Voir tous les résultats
Revue Politique et Parlementaire
  • Politique
  • International
  • Economie
  • Culture
  • Société
  • Science et technologie
  • La cité des débats
    • Faut-il avoir peur de l’avenir ?
    • Aimons-nous encore la liberté ?
    • Savoir, pouvoir et démocratie
    • S’engager au 21ème Siècle
  • Le printemps des techno
    • Edition 2023
    • Edition 2024
    • Edition 2025
  • Boutique
    • Les numéros
    • Abonnement
Aucun résultat
Voir tous les résultats
Revue Politique et Parlementaire
Aucun résultat
Voir tous les résultats
dans Libre opinion

Information et environnement

ParFrançois Képès
1 février 2021
Information et environnement

L’information a été le moteur de la croissance socio-économique de la civilisation depuis ses débuts. Actuellement, son stockage, archivage et traitement par les centres dédiés n’offrent plus de marges suffisantes d’optimisation pour faire face au déluge des données, et à son problématique impact environnemental. Un récent rapport de l’Académie des technologies explore une alternative prometteuse au modèle conventionnel : l’archivage des données à l’échelle moléculaire, un chantier de vingt ans. Par François Képès.

Défi

Nombre d’analystes estiment que la production d’information corrèle avec le bien-être social et la croissance économique. Or, la génération et l’utilisation de l’information ont connu une augmentation exponentielle durant les dernières décennies.

Comme ces activités sont de grandes consommatrices de ressources et d’énergie, elles sont devenues non soutenables au fil des ans, et ne seront plus supportables d’ici 2040.

Il est donc essentiel de diminuer leur impact sur notre environnement. Cet article propose diverses pistes en ce sens, après avoir évoqué les défis que présente la situation actuelle.

De quelles données parlons-nous ? Celles de nos connexions familiales, amicales et professionnelles, nos livres, vidéos et photos, nos données médicales, celles de la recherche scientifique, de l’industrie etc. Qu’est ce que représenterait l’ensemble des données accumulées par l’humanité, la « sphère globale des données » ? Notre unité sera le caractère, comme ceux qui composent ce texte : une lettre, un chiffre, un symbole. Par simplicité, assimilons un caractère à un octet, soit une suite de huit nombres ‘0’ ou ‘1’ dans un fichier qualifié de numérique pour cette raison. La sphère globale des données comprend actuellement autant de caractères (ou d’octets) qu’il y a d’étoiles dans l’univers observable : quelques dizaines de milliers de milliards de milliards de caractères. Pour transférer tout cela par internet à une vitesse moyenne, il faudrait 50 millions d’années. Pourquoi ces données sont de nature numérique ? Nos vieilles photos « argentiques » ne sont pas de cette nature. Mais tandis qu’elles virent inexorablement au sépia, nous mitraillons avec des appareils numériques. Le format numérique a l’avantage de pouvoir être traité par l’informatique, et aussi d’être en principe inaltérable. Pourquoi notre sphère globale des données augmente encore ? Elle double tous les deux à trois ans environ1, soit un facteur cent à mille en vingt ans, parce que son usage s’intensifie dans ses domaines traditionnels, et s’étend à de nouveaux secteurs : diagnostic et chirurgie à distance, voitures autonomes, capteurs, télésurveillance, réalité virtuelle. Notons incidemment que l’actuelle pandémie a encore augmenté nos interactions numériques : télétravail, téléconférence, téléconsultation. Comment conserve-t-on toutes ces données ? De moins en moins sur son propre ordinateur ou téléphone. De plus en plus dans des centres de données qui fonctionnent au sein de réseaux mondiaux de transmission. Ceci inclut le « cloud » ou « nuage » qui n’en est qu’une modalité plus virtuelle et automatisée offrant des ressources à la demande2.

Qu’est-ce qu’un centre de données ? Typiquement, un gros centre de données moderne contient un exaoctet (un milliard de milliards de caractères) ; un million de serveurs (des ordinateurs sans clavier ni écran) ; des disques durs ou mémoires statiques et des bandes magnétiques. Il loge dans un immense hangar planté sur un terrain de plusieurs centaines de milliers de m2. Il consomme plus d’électricité qu’une ville de cent mille habitants, dont environ 40 % pour le refroidissement des serveurs (d’où l’intérêt de positionner ces centres dans des régions froides du globe)3 ; des milliers de tonnes de métaux chers, de plastiques issus du pétrole, et des terres rares, des ressources coûteuses à produire ; un investissement de quelques milliards d’euros4. Sa durée de vie est de 20 ans. Les technologies de stockage utilisées par ces centres sont rapidement frappées d’obsolescence aux plans du format, du dispositif de lecture/écriture, et aussi du support lequel nécessite des copies tous les cinq à sept ans pour garantir l’intégrité des données5. Le marché global des dispositifs de stockage de données (disques, bandes) est en 2020 de 57 milliards de dollars, en augmentation de 2-3 % par an. Il faut ajouter au tableau les réseaux de connexions qui relient le centre au reste du monde, également consommateurs de ressources. Combien existe-t-il de centres de données ? Plusieurs millions, en incluant ceux des compagnies6. Mais s’ils contenaient tous un exaoctet, il en suffirait actuellement d’environ 50 mille sur la planète. Ensemble, tous ces centres couvrent actuellement un millionième des terres émergées de la planète. Ils consomment 2 à 4 % de l’électricité dans les pays avancés ; si tous ces centres formaient un seul pays par hypothèse, alors ce pays serait le cinquième plus gros consommateur d’électricité au monde, entre Inde et Japon7.

Sachant qu’en 2040 nous aurions cent à mille fois plus de données à conserver, ces chiffres démontrent que le modèle actuel de conservation sera d’ici là devenu insuffisant, tout en étant insupportable au plan environnemental.

Pistes

Les réponses face à ce redoutable défi multiforme sont de plusieurs ordres. Nous distinguerons ici cinq pistes, même si elles se recoupent parfois :

  1. économiser l’espace de stockage de données ;
  2. distinguer les données méritant d’être conservées ;
  3. compresser et interpréter les données ;
  4. éduquer le (futur) citoyen ;
  5. changer radicalement le modèle des centres de données.

Économiser l’espace de stockage de données

Supposons qu’un fichier numérique contenant la photo d’un sauvetage de koala soit stocké sur votre mémoire d’ordinateur ou de téléphone. Votre fichier est probablement sauvegardé en de multiples exemplaires dans divers centres de données comme votre espace « cloud », peut-être même à votre insu. Mais vous n’êtes pas seul à apprécier cette photo émouvante. Des millions d’individus l’ont échangée et gardée aussi en de multiples exemplaires. Si tous avaient conservé et transmis le lien internet vers cette photo (quelques caractères), plutôt que le fichier de la même photo (quelques 100 mille à 2 millions de caractères), le gain d’espace aurait été d’un facteur 5 à 100 mille.

Or dans les mémoires numériques, il n’y a pas que la photo d’un unique koala ; de plus, il n’y pas que des photos de koalas ; enfin, il n’y a pas que des photos.

Ce petit exemple montre comment la prise de conscience et la discipline de chacun peut entraîner une économie gigantesque au plan collectif.

Distinguer les données méritant d’être conservées

Bien sûr, toutes les données ne sont pas égales. De sublimes films, livres ou monuments anciens ont été numérisés et archivés, mais le coût récurrent de cet archivage les met actuellement en danger ; or ils font partie du patrimoine le plus précieux de l’humanité. À l’inverse, certaines données issus de capteurs sont utilisées en temps réel, les conserver n’offre aucun intérêt.

Schématiquement, il convient de distinguer trois types de données.

  • d’usage immédiat et d’intérêt nul dans le futur (par exemple venant de capteurs sur votre voiture, qui ont déterminé son passage automatique en 3e vitesse) ;
  • méritant un archivage longue durée, parfois nommé « stockage froid » (par exemple résultant des expériences passées de physique nucléaire, qui ne périment pas et doivent être transmises entre générations de physiciens) ;
  • intermédiaire (par exemple émanant des données de télésurveillance, qui ne sont conservées au-delà d’un jour que si une enquête est diligentée).

Dans le cadre professionnel, ces distinctions sont souvent opérées, et contribuent à desserrer provisoirement l’étau de l’actuel déficit en espace de stockage8. Pour poursuivre sur la lancée, il serait nécessaire d’élargir les domaines d’activités qui opèrent une fine distinction entre données requérant différentes durées de stockage, et qui automatisent la suppression d’information devenue inutile.

Compresser et interpréter les données

Le terme « compression » recouvre en général des techniques informatiques permettant de réduire la taille d’un fichier en perdant peu ou pas d’information utile. Par exemple si une image contient un grand à-plat de couleur constante, cette zone sera décrite plus concisément en indiquant une seule fois sa couleur, et en précisant géométriquement ses frontières, plutôt qu’en répétant la valeur de sa couleur pour chacun des nombreux pixels le constituant. Des exemples de standards de compression d’images sont PNG qui préserve toute l’information, ou JPEG qui en perd une part.

Ces techniques sont essentielles pour la réduction des volumes d’information à sauvegarder.

Pourtant, j’estime que des approches plus radicales doivent y être combinées au vu du fardeau grandissant des données.

Il s’agit ni plus ni moins de ce qu’on appelle en langage courant l’interprétation des informations, des données, des résultats.

Par exemple, supposons que nous souhaitions connaître les réactions d’une cellule vivant en culture dans le laboratoire, à un traitement médicamenteux. Pour cela, supposons qu’après application du médicament, nous ayons mesuré l’évolution temporelle et spatiale de la production de ses dizaines de milliers de protéines, grâce à une série d’images prises à très haute résolution au microscope. Finalement, supposons que nous décrivions notre expérience et ses résultats dans un article scientifique. Nous conclurons par exemple que « si telle cellule subit tel traitement, alors les productions de ses protéines P1 et P2 baissent respectivement de 40 et 26% en 65 minutes ». C’est là l’interprétation du plus haut niveau possible. Il est donc possible de remplacer des centaines de lourds fichiers d’images (des milliers de milliards de caractères) par une phrase de quelques caractères, soit un gain d’un facteur de plusieurs milliards. En pareil cas, les lourds fichiers pourraient être automatiquement supprimés après un délai de recours ou vérification, par exemple un an après publication de cet article. Au-delà, seule serait conservée l’interprétation signifiante, c’est-à-dire la phrase contextualisée par le reste de l’article scientifique.

Il sera indispensable d’introduire cette « compression par l’interprétation » (accompagnée bien sûr de compression informatique conventionnelle). Je suggère de réfléchir dès maintenant à ses modalités selon les cas qui se présentent dans les très divers champs de l’activité humaine.

Éduquer le (futur) citoyen

75 % des humains seront connectés en 2025, et chacun interagira avec des données toutes les 18 secondes en moyenne9. L’art de diminuer notre impact environnemental lié à l’usage des données devrait faire partie des apprentissages numériques de base depuis l’enfance.

Le point 1 portant sur l’économie de l’espace de stockage pourrait être enseigné de manière ludique et visuelle dès l’âge des premiers terminaux informatiques, souvent le téléphone mobile confié à un enfant. Le point 2 concernant la durée de conservation des informations pourrait faire l’objet de sensibilisation progressive durant les cycles secondaires d’enseignement, en s’appuyant concrètement sur les activités habituelles de cet âge. Le point 3 portant sur la compression et son avatar ultime, l’interprétation, pourrait tôt faire l’objet d’une prise de conscience, pour ensuite évoluer et se spécialiser au gré des activités professionnelles de chacun. Quant au point 5 qui suit, il serait utile à tous les adultes connectés d’avoir quelques notions du fonctionnement des centres de données, pour bien motiver et diriger leurs efforts d’économie.

Changer radicalement le modèle des centres de données

Pour le stockage et l’archivage des données, les centres reposent sur des solutions admirables au plan technique, mais n’offrant plus de marges suffisantes d’optimisation pour faire face au déluge des données. En outre, leur impact environnemental est déjà problématique. Un chantier de vingt ans se dresse devant nous, pour révolutionner ces technologies.

L’Académie des technologies s’est penchée sur cette question durant deux années et a publié un rapport en 202010. Après avoir passé en revue plusieurs approches ne présentant pas les caractéristiques requises, son groupe de travail s’est focalisé sur les supports moléculaires porteurs d’information, tel que l’ADN utilisé ici comme agent chimique en dehors du vivant, ou d’autres polymères11 non-ADN très prometteurs12. Potentiellement, l’ADN permet des densités informationnelles dix millions de fois supérieures aux mémoires traditionnelles : la sphère globale des données actuelle tiendrait dans une fourgonnette. L’ADN est stable à température ordinaire durant plusieurs millénaires13, sans consommation énergétique14. Il peut être aisément multiplié ou détruit à volonté. Certains calculs peuvent être physiquement implémentés avec des fragments d’ADN15. En outre, l’obsolescence du support ADN ne se produira pas tant que l’homme disposera des technologies nécessaire à l’écriture et à la lecture de l’ADN, qui font partie intégrante de la médecine moderne.

Pour archiver et retrouver des données dans l’ADN, il convient d’enchaîner cinq étapes (figure) : coder le fichier de données binaires dans l’alphabet de l’ADN qui possède quatre lettres, puis écrire, stocker, lire l’ADN, et enfin décoder l’information lue. Un prototype réalisant ces opérations fonctionne depuis mars 2019 chez Microsoft aux États-Unis16. Notons que la preuve de principe de cette approche d’archivage moléculaire des données a été apportée17. Cependant, la viabilité économique de cette approche ne sera atteinte qu’en améliorant les coûts et vitesses des technologies de l’ADN : d’un facteur mille pour la lecture, et cent millions pour l’écriture. Ces facteurs peuvent sembler faramineux. Ce serait oublier la célérité des progrès des technologies de l’ADN, proches d’un facteur mille tous les cinq ans, donc bien plus rapides que dans les domaines électronique et informatique18.

Conclusion

Au-delà des approches théoriques, empiriques ou éducatives visant à limiter la quantité d’information engendrée par l’humanité, son archivage moléculaire constitue un enjeu majeur et stratégique à horizon proche.

Face aux limites physiques qu’atteignent les centres de données8, la technologie moléculaire d’archivage des mégadonnées a le potentiel de devenir économiquement viable entre 2025 et 2040, progressant de marchés de niche dans les 5-10 ans vers des marchés plus globaux dans les 10-20 ans. Dans le futur proche, le handicap principal de l’ADN résidera en la lenteur des procédés de lecture et surtout d’écriture. Donc son usage se cantonnera initialement au stockage froid et à l’archivage de données nécessitant d’être conservées longtemps, où ses avantages sont évidents, en compétition ou complémentarité avec l’actuelle solution, la bande magnétique.

{ En France, au moins un laboratoire et deux petites entreprises (dont l’une vient d’être dotée par une agence des États-Unis) y ont des positions originales et fortes dans les segments-clé que sont les polymères non-ADN, la synthèse enzymatique de l’ADN, et son stockage de très longue durée19. Au-delà, il existe en France un gisement de compétences pertinentes en biologie, chimie, informatique et sciences de l’ingénieur, qui pourraient être mobilisées dans une nécessaire synergie entre secteurs public et privé. }.

Étapes du processus de stockage des mégadonnées numériques sur l’ADN. Ici sont représentés pour exemple 12 bits successifs extraits du fichier numérique.
Ces 12 bits sont codés sous la forme de 6 nucléotides qui sont écrits en succession dans une molécule d’ADN. Cet ADN est ensuite stocké.
Puis il est lu, et la séquence de nucléotides ainsi obtenue est décodée pour reconstituer le fichier numérique d’origine.

Crédit : François Képès.

François Képès
Animateur du groupe de travail « ADN : lire, écrire, stocker l’information » de l’Académie des technologies
Académie des technologies
Académie d’Agriculture de France

———-

  1. Reinsel D, Gantz J, Rydning J (2018). The Digitization of the World – From Edge to Core (International Data Corporation & SeaGate). ↩
  2. https://www.datacentermap.com ↩
  3. Davey J (2019). Powering the data revolution (HSBC Global Research). ↩
  4. Cook G (2012). How clean is your cloud? (Greenpeace International) — https://www.greenpeace.org/archive-international/Global/international/publications/climate/2012/iCoal/HowCleanisYourCloud.pdf ↩
  5. Hourcade J-C, Laloë F, Spitz E (2010). Longévité de l’information numérique. Académie des Technologies & Académie des Sciences (EDP Sciences). ↩
  6. http://hebergement-et-infrastructure.fr/actualites-et-innovations/8-6-millions-de-datacenters-dans-le-monde-en-2017https://www.businesswire.com/news/home/20141110005018/en/IDC-Finds-Growth- ↩
  7. https://www.datacenterknowledge.com/archives/2016/06/27/heres-how-much-energy-all-us-data-centers-consume ↩
  8. International Data Corporation digital universe study ­— https://www.idc.com/ ↩
  9. HiPEAC Vision 2015 (Commission Européenne, FP7, 2015). ↩
  10. Académie des technologies (2020). Rapport « Archiver les mégadonnées au-delà de 2040 : la piste de l’ADN » — https://www.academie-technologies.fr/blog/categories/publications-de-l-academie/posts/archiver-les-megadonnees-au-dela-de-2040-la-piste-de-l-adn ↩
  11. Un polymère est une grande molécule constituée de nombreuses sous-unités répétées, appelées monomères. Pour stocker de l’information, il faut un polymère constitué d’au moins deux sortes de monomères, représentant le ‘0’ et le ‘1’. L’ADN par exemple a quatre monomères différents. ↩
  12. Chaput JC, Herdewijn P, Hollenstein M. Orthogonal Genetic Systems (2020). Chembiochem 21(10):1408-1411.Hoshika H et al. (2019). Hachimoji DNA and RNA: A genetic system with eight building blocks. Science 363:884-887. Colquhoun H & Lutz JF (2014). Information-containing macromolecules. Nature Chemistry 6:455-456. ↩
  13. Bonnet J, Colotte M, Coudy D, Couallier V, Portier J, Morin B, Tuffet S (2010). Chain and conformation stability of solid-state DNA: implications for room temperature storage. Nucleic Acids Res. 38(5):1531-46 — http://www.imagene.fr/dnashell-rnashell/dnashell/ ↩
  14. Mais les opérations sur l’ADN ont un coût. Le IARPA états-unien estime que la consommation énergétique globale serait diminuée d’un facteur 1 000 en usant de l’ADN plutôt que de l’approche conventionnelle — https://www.iarpa.gov/index.php/research-programs/mist ↩
  15. Adelman, LM (1994). Molecular computation of solutions to combinatorial problems, Science 266, 5187:1021-1024. ↩
  16. Takahashi CN, Nguyen BH, Strauss K, Ceze L (2019). Demonstration of End-to-End Automation of DNA Data Storage. Scientific Reports 9(1):4998. ↩
  17. Church GM, Gao Y, Kosuri S (2012). Next-Generation Digital Information Storage in DNA. Science 337:1628. Goldman N, Bertone P, Chen S, Dessimoz C, Leproust EM (2013). Toward practical, high-capacity, low maintenance information storage in synthesized DNA. Nature 494:77-90. Ceze L, Nivala J, Strauss K (2019). Molecular digital data storage using DNA. Nat Rev Genet. 20:456–466. ↩
  18. Une loi empirique semble régir l’évolution des capacités de stockage, qui jusqu’à présent doublent environ tous les 2 ans. ↩
  19. http://recherche.unistra.fr/index.php?id=30740   http://www.imagene.fr/   http://www.dnascript.com/ ↩
François Képès

Les derniers articles

EUROPE, L’URGENCE DE NOUVELLES ROUTES DES ECHANGES

EUROPE, L’URGENCE DE NOUVELLES ROUTES DES ECHANGES

ParMichel Scarbonchi

La première présidence  de Donald TRUMP nous avait sidéré, les débuts de sa seconde présidence nous terrifie. Tout autant par...

1945-2025 : les promesses de la Victoire des Alliés emportées par la bascule du monde ?

1945-2025 : les promesses de la Victoire des Alliés emportées par la bascule du monde ?

ParPascal Drouhaudet1 autre

« Si vis pacem, para bellum », « Si tu veux la paix, prépare la guerre » ! Plus que jamais, la célèbre maxime romaine...

Cadres licenciés avec une obligation de silence : un préjudice à l’intérêt général

Cadres licenciés avec une obligation de silence : un préjudice à l’intérêt général

ParPascal Perez

Le livre de Sarah Wynn-Williams sur Facebook, Careless People, révèle que le silence imposé dans les accords de séparation entre...

Du Baron Empain aux enlèvements dans la cryptomonnaie : ce que dit une société

Du Baron Empain aux enlèvements dans la cryptomonnaie : ce que dit une société

ParPierre Larrouy

Les enlèvements du baron Empain en 1978 et de David Balland en 2025 partagent un même geste (par discrétion je...

Retrouvez nos dernières vidéos

Sorry, there was a YouTube error.

Inscrivez-vous à notre Newsletter

Related Posts

Du Baron Empain aux enlèvements dans la cryptomonnaie : ce que dit une société
Libre opinion

Du Baron Empain aux enlèvements dans la cryptomonnaie : ce que dit une société

   Le pontificat singulier du pape François : Une tension entre autorité spirituelle et leader d’opinion
Libre opinion

   Le pontificat singulier du pape François : Une tension entre autorité spirituelle et leader d’opinion

« TAXER » LES RETRAITES : avancée sociale et carambouille budgétaire !
Libre opinion

« TAXER » LES RETRAITES : avancée sociale et carambouille budgétaire !

L’héritage politique original du Pape François
Libre opinion

L’héritage politique original du Pape François

Mort du pape, la France se drape d’un deuil qui nous aliène tous
Libre opinion

Mort du pape, la France se drape d’un deuil qui nous aliène tous

Boualem Sansal : symbole intemporel de la lutte pour la liberté
Libre opinion

Boualem Sansal : un écrivain dans la gueule de l’Histoire

Comment endiguer l’idéologie islamiste ?
Libre opinion

Le long chemin du combat contre l’islamisme

Que peut faire le gouvernement Attal après les élections législatives des 30 juin et 7 juillet ?
Libre opinion

Seul comme un Français juif en 2025…

Article suivant
La défaite de Gérald Darmanin face à l’islamisme

La défaite de Gérald Darmanin face à l’islamisme

La Revue Politique et Parlementaire
10 rue du Colisée 75008 Paris
Email : contact@revuepolitique.fr
Téléphone : 01 76 47 09 30

Notre Histoire
L'équipe
Mentions légales

Culture
Economie
Faut… de la géopolitique
International
La tribune du parlementaire
Libre opinion
Politique
Science et technologie
Société
Vie du parlement
Nos vidéos

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Se connecter

Add New Playlist

Aucun résultat
Voir tous les résultats
  • Politique
  • International
  • Economie
  • Culture
  • Société
  • Science et technologie
  • La cité des débats
    • Faut-il avoir peur de l’avenir ?
    • Aimons-nous encore la liberté ?
    • Savoir, pouvoir et démocratie
    • S’engager au 21ème Siècle
  • Le printemps des techno
    • Edition 2023
    • Edition 2024
    • Edition 2025
  • Boutique
    • Les numéros
    • Abonnement

Revue Politique et Parlementaire