La tension monte d’un cran entre les partisans du logiciel libre et le géant de Redmond. Dans une série de publications, The Document Foundation (TDF), qui pilote le développement de la suite bureautique LibreOffice, s’attaque frontalement à la stratégie de Microsoft concernant ses formats de documents. L’accusation est simple : le format Office Open XML (OOXML), utilisé pour les fichiers .docx ou .xlsx, serait une forteresse numérique conçue pour empêcher toute concurrence loyale.
Microsoft a-t-il volontairement complexifié ses formats ?
Selon Italo Vignoli, co-fondateur de TDF, la réponse est un oui sans équivoque. Il dénonce une complexité qu’il juge délibérée, transformant ce qui devrait être un pont d’interopérabilité en une véritable barrière. Le schéma XML de Microsoft est comparé à un système ferroviaire dont les rails sont publics, mais dont le système de contrôle est si opaque que seul le constructeur d’origine peut y faire circuler ses trains. Pour la fondation derrière LibreOffice, les utilisateurs deviennent alors les otages involontaires de ce verrouillage numérique.
Cette complexité n’est pas théorique. La spécification de l’OOXML s’étend sur près de 7 000 pages, un volume qui rend son implémentation complète par un tiers quasi impossible. Pire encore, Microsoft Office n’adhérerait même pas à son propre standard « Strict », préférant une variante « Transitoire » qui intègre des dépendances à d’anciens logiciels propriétaires. On y trouve des reliques comme « autoSpaceLikeWord95 », un héritage technique forçant les autres logiciels à imiter les bugs de vieilles versions de Word pour être compatibles.
Quelles sont les conséquences concrètes de ce « verrouillage » ?
L’un des exemples les plus frappants et dommageables vient du monde de la recherche génétique. Pendant des années, le comportement par défaut d’Excel a consisté à convertir automatiquement certains textes en dates. Ainsi, le nom d’un gène comme « MARCH1 » (Membrane Associated Ring-CH-Type Finger 1) était systématiquement transformé en « 1-Mar ». Des milliers de données scientifiques ont été corrompues par cette conversion automatique, avec des conséquences directes sur la recherche.
Une étude de 2016 a révélé qu’environ un cinquième des articles scientifiques publiés avec des fichiers Excel en supplément contenaient ce type d’erreurs. Il a fallu attendre 2023 pour que Microsoft déploie un correctif, soit trois ans après que le comité de nomenclature des gènes a été contraint de renommer 27 gènes pour éviter le problème. Pour les critiques, ce retard illustre comment les intérêts commerciaux peuvent primer sur les besoins, même critiques, d’une partie des utilisateurs.
Existe-t-il une alternative fiable pour l’archivage à long terme ?
Face à ces formats propriétaires jugés opaques, The Document Foundation prône une solution : le OpenDocument Format (ODF). Il s’agit d’un standard ouvert ISO, géré de manière transparente par un consortium indépendant. Contrairement à l’OOXML, ses spécifications sont publiques et conçues pour garantir l’interopérabilité et la pérennité des données. Un fichier créé en ODF en 2005 reste parfaitement lisible et éditable en 2025.
Le conseil de la fondation est donc clair : pour les documents qui nécessitent une conservation sur le long terme et qui peuvent être amenés à être modifiés, l’ODF est la solution à privilégier. Pour les documents finalisés qui ne seront plus édités, le format PDF reste une option d’archivage viable. L’enjeu est de taille : s’assurer que nos propres données ne deviendront pas illisibles lorsque les logiciels actuels deviendront obsolètes.
Foire Aux Questions (FAQ)
Qu’est-ce que le format OOXML ?
Office Open XML (OOXML) est le format de fichier basé sur XML développé par Microsoft pour sa suite bureautique. C’est lui qui se cache derrière les extensions .docx, .xlsx et .pptx. Bien qu’il soit un standard ISO, ses détracteurs lui reprochent sa complexité extrême et ses dépendances à des technologies propriétaires de Microsoft.
Pourquoi le format ODF est-il considéré comme plus sûr ?
L’OpenDocument Format (ODF) est également un standard ISO, mais il est géré par le consortium OASIS, de manière ouverte et indépendante de toute entreprise. Sa conception vise la simplicité, la transparence et la compatibilité à long terme, ce qui garantit que les documents resteront accessibles, quel que soit le logiciel utilisé à l’avenir.
Le problème des noms de gènes dans Excel est-il résolu ?
Oui, Microsoft a finalement introduit une option dans Excel en 2023 pour désactiver la conversion automatique de certains textes en dates. Cependant, cette mise à jour est intervenue tardivement, après que des années de recherche ont été affectées et que la communauté scientifique a dû adapter ses propres standards pour contourner le problème.

