Qu'est-ce que le PDF/A ?
Le PDF/A est une norme ISO (ISO 19005) dérivée du PDF standard, conçue pour garantir qu'un document restera lisible de façon identique dans 10, 50 ou 100 ans — indépendamment des logiciels disponibles à l'époque. L'objectif est l'auto-suffisance : le fichier doit contenir tout ce dont il a besoin pour être rendu, sans dépendre de ressources externes.
Pour atteindre cet objectif, le PDF/A impose plusieurs contraintes strictes. Toutes les polices utilisées dans le document doivent être intégralement incorporées dans le fichier — pas de référence à une police système qui pourrait ne plus exister dans 20 ans. Les espaces colorimétriques utilisés pour les images doivent être explicitement définis et embarqués (profils ICC). Sans cela, les couleurs d'une image pourraient être interprétées différemment selon le système d'affichage.
Le PDF/A interdit également tout ce qui dépend d'un environnement externe ou dynamique : JavaScript, liens vers des ressources externes (images ou polices sur le web), chiffrement, et formulaires dynamiques. Ces éléments peuvent fonctionner aujourd'hui mais devenir inopérants dans quelques années si les dépendances disparaissent. En les excluant, le PDF/A garantit que le document est figé dans un état stable et autonome.
PDF/A-1, PDF/A-2, PDF/A-3 : les variantes
PDF/A-1 est la première version de la norme, publiée en 2005. C'est la plus restrictive : elle n'autorise pas les calques (contenus optionnels), pas de transparence dans les images, et est basée sur PDF 1.4. Elle convient parfaitement aux documents texte simples — rapports, contrats, formulaires. Sa rigueur en fait la référence pour les archives légales et judiciaires les plus exigeantes.
PDF/A-2, publié en 2011, étend les capacités en s'appuyant sur PDF 1.7. Il autorise la compression JPEG 2000 (plus efficace que le JPEG classique), les calques et la transparence. Il permet aussi l'incorporation d'autres fichiers PDF/A à l'intérieur du document. PDF/A-2 est aujourd'hui le format recommandé pour la plupart des usages d'archivage — il offre un bon équilibre entre rigueur et expressivité.
PDF/A-3 va plus loin en permettant d'embarquer des fichiers de n'importe quel type à l'intérieur du PDF. C'est le format utilisé pour les factures électroniques structurées (comme Factur-X en France et en Allemagne) : le PDF contient à la fois une version lisible pour l'humain et un fichier XML pour le traitement automatisé par les logiciels comptables. Si vous travaillez avec des factures ou des documents qui doivent être à la fois lisibles et traités par machine, PDF/A-3 est fait pour vous.
Quand utiliser PDF/A ?
Les archives légales et judiciaires sont le premier domaine d'application. Jugements, actes notariés, contrats commerciaux importants — tout document ayant une valeur probante à long terme bénéficie du PDF/A. Plusieurs systèmes judiciaires européens imposent désormais le PDF/A pour le dépôt électronique de pièces.
Les administrations publiques ont souvent une obligation réglementaire. En France, la DINUM (Direction interministérielle du numérique) recommande le PDF/A pour l'archivage des documents administratifs. Certaines procédures — marchés publics, déclarations fiscales — imposent explicitement ce format dans leur cahier des charges.
Les thèses universitaires et travaux de recherche sont un autre cas fréquent. Les grandes bibliothèques numériques (HAL, DART-Europe) acceptent ou exigent le PDF/A pour garantir que les travaux resteront accessibles et imprimables dans des décennies. Une thèse déposée en PDF/A-2 aujourd'hui sera lisible en 2075 sans question sur la compatibilité des polices ou des espaces colorimétiques.
Limites du PDF/A
Le PDF/A n'est pas adapté à tous les usages. Il n'autorise pas la vidéo embarquée, ni l'audio, ni les formulaires avec calculs dynamiques (comme les formulaires fiscaux qui calculent des totaux automatiquement). Si votre document nécessite ces fonctionnalités, le PDF/A n'est pas le bon format.
Le chiffrement est interdit dans le PDF/A. Un document PDF/A ne peut pas être protégé par mot de passe — par définition, il doit être accessible à tout logiciel de lecture sans clé secrète. Si votre document contient des informations sensibles qui doivent rester confidentielles, vous devez choisir entre confidentialité et archivage à long terme selon la norme.
La taille de fichier est légèrement plus grande qu'un PDF équivalent, principalement parce que toutes les polices sont intégralement incorporées plutôt que sous-ensemblées. Dans la pratique, la différence est de l'ordre de 100 à 500 Ko selon les polices utilisées — négligeable pour des documents de travail.