GitHub enterre 21 téraoctets de données dédiées à la postérité

GitHub enterre 21 téraoctets de données dédiées à la postérité


Il ne s’agit pas de science-fiction : GitHub a mis la touche finale à son Arctic Code Vault, une boîte en acier de près de 1,5 tonne recouverte de gravures générées par l’intelligence artificielle qui visent à inciter les générations futures à l’explorer. GitHub avait initialement déposé son instantané de 21 téraoctets du 20 février 2020 de tous les dépôts publics peu après le début de la pandémie. Aucun des employés de la société n’était toutefois présent pour y assister ou y participer à cause de la pandémie.

L’instantané, en grande partie codé en QR code, est stocké sur plus de 180 bobines de film qui se trouvent, depuis juillet, à 250 mètres de profondeur dans une montagne du Svalbard, en Norvège, dans une ancienne mine de charbon. L’endroit est froid, proche du pôle Nord, mais aussi de la réserve mondiale de semences du Svalbard. Etant donné que les archives doivent être conservées pendant 1 000 ans, il est presque certain qu’aucun des géants de la technologie d’aujourd’hui n’existera à ce moment-là, pas plus que les technologies qu’ils ont produites – des réseaux aux logiciels, en passant par les smartphones et les langages de programmation.

« Arctic Code de GitHub est désormais une véritable chambre forte, avec nos bobines de film d’archives reposant en toute sécurité dans son édifice de 1 400 kg. Même si ses héritiers dans plusieurs siècles ne savent pas ce que c’est, ils reconnaîtront certainement que c’est quelque chose d’extraordinaire », a écrit Jon Evans, directeur fondateur du programme d’archives de GitHub.

Sauvegarder les connaissances actuelles

« Une quantité inquiétante de connaissances mondiales est actuellement stockée sur des supports éphémères », explique le dirigeant pour justifier ce dispositif, en faisant référence aux disques durs et aux CD-ROM. « Notre espoir est qu’en stockant et en indexant des millions de dépôts, nous avons capturé un échantillon précieux du monde du logiciel moderne. »

Un autre ajout potentiellement utile est ce que le projet appelle l’arbre technique – une sélection d’ouvrages, pour la plupart lisibles par l’être humain, décrivant comment le monde utilise les logiciels aujourd’hui.

Cet arbre est divisé en 13 sections couvrant : le fonctionnement des ordinateurs et leur connexion ; les algorithmes et les structures de données ; les compilateurs, les assembleurs et les systèmes d’exploitation ; les langages de programmation ; la mise en réseau et la connectivité ; le développement de logiciels modernes ; les applications logicielles modernes ; les architectures matérielles et le développement du matériel, les composants électroniques ; les technologies antérieures à l’électricité ainsi que la culture et l’histoire écrite au cours des 150 dernières années.

Source : ZDNet.com





Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.