Pourquoi les PDF deviennent-ils si lourds ?
La réponse courte : les images. Un PDF peut contenir du texte, des polices vectorielles, des métadonnées — mais aucun de ces éléments ne pèse lourd. Une photo JPEG de 3 Mo embarquée dans un document, elle, représente à elle seule 90 % du poids du fichier.
Les documents scannés sont le cas extrême. Une page A4 scannée à 300 dpi en couleur produit une image d'environ 2 500 × 3 500 pixels — soit 1 à 3 Mo par page avant compression. Un rapport de 20 pages scanné peut facilement peser 40 Mo. La plupart des scanners utilisent le format TIFF non compressé ou un JPEG à qualité élevée par défaut, ce qui aggrave la situation.
Les polices intégrées contribuent aussi, mais de façon bien moindre. Une police embarquée dans un PDF pèse entre 50 et 200 Ko. Si le document utilise 5 polices, cela représente au maximum 1 Mo — négligeable comparé aux images.
Les métadonnées accumulées (historique des révisions dans Word avant export PDF, commentaires de relecture, aperçus miniatures en haute résolution) s'ajoutent discrètement. Sur un document qui a circulé pour corrections entre plusieurs personnes, ces couches de données cachées peuvent atteindre plusieurs mégaoctets.
Les trois méthodes de compression PDF
La méthode la plus efficace est la recompression des images embarquées. L'idée est simple : une image insérée dans un PDF à 300 dpi n'a pas besoin de cette résolution si le document est destiné à être lu sur écran. Descendre à 150 dpi réduit la taille de l'image de 75 % (surface divisée par 4) sans que l'oeil perçoive de différence à l'écran.
La deuxième méthode est la suppression des métadonnées inutiles. Un outil de compression PDF peut éliminer l'historique des révisions, les commentaires cachés, les aperçus en haute résolution et les données XMP (métadonnées étendues) sans affecter le contenu visible du document. Selon l'historique du fichier, cela peut libérer plusieurs centaines de kilooctets.
La troisième méthode — le downsampling des images haute résolution — consiste à réduire la résolution des images avant de les réintégrer. C'est différent de simplement changer la valeur DPI dans les métadonnées : les pixels sont réellement supprimés. Un PDF dont toutes les images dépassent 200 dpi peut être rendu nettement plus léger en limitant toutes les images à 150 dpi.
Ces trois méthodes combinées produisent en général une réduction de 50 à 80 % sur les PDF scannés, et de 20 à 40 % sur les PDF mixtes (texte + images).
Quand la compression PDF est-elle sans risque ?
Pour les documents texte pur — factures générées par logiciel, contrats rédigés sous Word — la compression est totalement sans risque. Le texte en PDF est stocké sous forme vectorielle et ne se dégrade pas avec la compression. Vous pouvez compresser un tel document plusieurs fois sans aucune perte visible.
Pour les documents destinés à l'impression, il faut être plus vigilant. Une affiche ou une plaquette commerciale conçue pour être imprimée à haute résolution perdra en netteté si les images sont downsampleées en dessous de 200 dpi. Dans ce cas, gardez l'original haute résolution et ne compressez qu'une copie de diffusion.
Pour les archives légales — actes notariés, décisions judiciaires, dossiers médicaux — la prudence s'impose. Certains formats d'archivage (PDF/A) interdisent explicitement certaines transformations. Si vous archivez un document à valeur probante, conservez toujours l'original non compressé en parallèle.
Cas pratiques
Un CV : les recruteurs reçoivent des centaines de candidatures et les boites mail ont des limites de pièces jointes. Un CV en PDF dépasse rarement 1 Mo s'il est correctement optimisé. Si votre CV pèse 8 Mo, c'est souvent qu'il contient une photo en haute résolution ou qu'il a été exporté depuis Word sans optimisation. Une compression ramènera le fichier sous 500 Ko sans aucune perte visible.
Une facture : le format doit rester lisible et professionnel, mais une facture n'a pas besoin d'images haute résolution. Les logos d'entreprise embarqués en TIFF ou PNG sans compression alourdissent souvent les factures inutilement. Compresser à 150 dpi rend le fichier léger et les logos restent parfaitement nets à l'écran.
Un rapport d'audit : document souvent volumineux (graphiques, tableaux, photos de terrain), il circule entre de nombreux intervenants. Une version compressée à 72-96 dpi pour la diffusion électronique est tout à fait appropriée, tant que l'original haute résolution est conservé pour impression éventuelle.