Warum ist mein PDF so groß? (Und wie man es verkleinert)
Hochauflösende Bilder, gescannte Seiten, eingebettete Schriften und doppelte Objekte blähen ein PDF auf. Hier sind die Ursachen und ihre Lösungen.
Du hast ein zweiseitiges Dokument fertiggestellt, es als PDF exportiert und stehst irgendwie mit einer 40 MB großen Datei da, die sich partout nicht an eine E-Mail anhängen lässt. Das ist eine erstaunlich verbreitete Erfahrung. Ein PDF ist nicht eine einzige Sache, sondern ein Container, der Text, Schriften, Bilder, Vektorgrafiken und Metadaten in einer einzigen Datei bündelt. Wenn diese Datei riesig ist, kommt die Größe fast immer von einigen wenigen, konkreten Übeltätern. Sobald du weißt, wer schuld ist, ist das Verkleinern des PDFs ganz einfach. Diese Anleitung geht jede Ursache durch und die Lösung, die wirklich für sie funktioniert.
Was wirklich in einem PDF steckt
Ein PDF speichert Inhalte als Sammlung von Objekten: Textströme, Bilddaten, Schriftprogramme und die Anweisungen, die sie auf der Seite anordnen. Das Format ist durch einen offenen ISO-Standard definiert, und der Überblick der PDF Association zu ISO 32000 ist eine gute Referenz, wenn du die formalen Details möchtest. Die praktische Erkenntnis ist einfach: Text und Vektorgrafiken sind winzig, während Bilder im Vergleich enorm sind. Eine ganze Seite mit dichtem Text kann nur ein paar Kilobyte belegen. Ein einziges seitenfüllendes Foto kann mehrere Megabyte belegen. Wenn ein PDF also unerwartet groß ist, lautet die erste Frage, die man sich stellen sollte, fast immer: Wo kommen die Bilder her?
Ursache Nr. 1: hochauflösende eingebettete Bilder
Das ist der mit Abstand häufigste Grund, warum ein PDF in der Größe explodiert. Wenn du ein Foto von einem modernen Smartphone oder einer modernen Kamera in ein Dokument ziehst, kann es 4000 Pixel breit oder mehr sein. Obwohl es auf der Seite mit einem Bruchteil dieser Größe angezeigt wird, speichert das PDF oft die volle Auflösung. Für ein Dokument, das am Bildschirm gelesen oder in normaler Qualität gedruckt werden soll, brauchst du selten mehr als 150 Pixel pro Zoll (PPI); für hochwertigen Druck sind 300 PPI mehr als genug. Alles darüber hinaus ist verschwendetes Gewicht.
Die Lösung besteht darin, diese Bilder herunterzurechnen und neu zu komprimieren, bevor oder nachdem sie ins PDF gelangen. Wenn du die Ausgangsbilder kontrollierst, verkleinere sie zuerst: Schick sie durch den JPEG-Kompressormit einer Qualität von 70–80 und passe sie auf die Maße an, die du tatsächlich brauchst. Wenn die Bilder bereits ins PDF eingebacken sind, schick die ganze Datei durch den PDF-Kompressor, der die eingebetteten Bilder mit einer geringeren, sinnvollen Größe neu codiert. Bei fotografischen Inhalten reduziert allein dieser Schritt die Datei oft um 80 Prozent oder mehr.
Ursache Nr. 2: gescannte Seiten
Ein gescanntes Dokument ist ein Sonderfall, und ein besonders schwerer. Wenn du Papier scannst, wird jede Seite zu einem seitenfüllenden Bild: Es gibt überhaupt keinen echten Text in der Datei, nur Bilder von Text. Scanner sind häufig standardmäßig auf sehr hohe DPI-Werte eingestellt (600 DPI ist üblich) und auf Vollfarbe, was riesige Dateien für etwas erzeugt, das im Grunde schwarze Tinte auf weißem Papier ist.
Du kannst zwei Dinge tun. Erstens: klüger scannen. Bei einem Textdokument kann das Scannen mit 200–300 DPI in Graustufen oder Schwarz-Weiß statt mit 600 DPI in Farbe die Größe drastisch reduzieren, ohne dass es an Lesbarkeit verliert. Zweitens: Scans, die du bereits hast, neu komprimieren. Beim Durchlauf der Datei durch den PDF-Kompressor werden diese Seitenbilder mit einer vernünftigeren Auflösung und Qualität neu codiert. Sei aber realistisch bezüglich der Grenze: Ein Scan ist im Kern ein Stapel von Bildern, also wird er immer größer sein als ein digital erstelltes Text-PDF derselben Länge.
Ursache Nr. 3: eingebettete Schriften und doppelte Objekte
PDFs betten die Schriften ein, die sie verwenden, damit das Dokument auf jedem Gerät identisch aussieht, was für die Originaltreue großartig ist, aber Gewicht hinzufügt. Ein gut funktionierendes Export-Werkzeug erstellt Teilmengen der Schriften und bettet nur die Zeichen ein, die tatsächlich verwendet werden. Schlecht konfigurierte Werkzeuge betten die gesamte Schriftfamilie ein, und ein Dokument, das mehrere dekorative Schriftarten verwendet, kann mehrere Megabyte an Schriftdaten mit sich tragen, die es kaum berührt. Sich auf eine kleine Auswahl gängiger Schriften zu beschränken und die Software Teilmengen bilden zu lassen, hält das in Schach.
Dann gibt es die schlichte Ineffizienz. Manche Software schreibt dasselbe Bild oder dieselbe Ressource mehrfach in die Datei, anstatt sie nur einmal zu referenzieren: Ein Logo, das im Kopfbereich jeder Seite erscheint, kann dutzendfach eingebettet werden. Wiederholte „Speichern unter“-Zyklen und inkrementelle Änderungen können ebenfalls verwaiste, überholte Objekte hinterlassen, die nie bereinigt werden. Das erneute Speichern des PDFs mit einem Werkzeug, das seine Objektstruktur neu schreibt und Duplikate entfernt, räumt das automatisch auf.
Ursache Nr. 4: Metadaten, Anhänge und Überreste
Die kleineren Faktoren summieren sich. PDFs können Dokument-Metadaten, XMP-Pakete, eingebettete Farbprofile, Miniaturansichten, Formularfelddaten, JavaScript und sogar ganze Dateianhänge enthalten. Aus Design-Software exportierte Dokumente enthalten manchmal versteckte Ebenen, Kommentare oder Versionsverlauf. Nichts davon ist auf der Seite sichtbar, aber alles zählt zur Gesamtzahl der Bytes. Das Optimieren oder „Reduzieren auf eine Ebene“ des PDFs entfernt die Teile, die du nicht brauchst, und lässt den sichtbaren Inhalt unangetastet.
Wenn sich ein PDF kaum verkleinern lässt
Komprimierung ist keine Zauberei, und es hilft zu wissen, wann man am Boden angekommen ist. Wenn dein PDF überwiegend echten Text und Vektorgrafiken enthält – ein digital erstellter Bericht, ein Vertrag, ein Code-Listing –, ist es wahrscheinlich schon klein, und es gibt wenig zu gewinnen. Die Bytes leisten nützliche Arbeit, und stärker zusammenzudrücken hilft nicht. Die großen Gewinne kommen fast ausschließlich von Bildern: hochauflösenden Fotos und gescannten Seiten. Wenn das erneute Komprimieren dieser nichts bewegt, war deine Datei wahrscheinlich von vornherein nicht bildlastig.
Eine schnelle Methode, das zu diagnostizieren: Frag dich, ob du den Text im Dokument auswählen und kopieren kannst. Wenn ja, ist es digital erstellt und die Größe kommt von eingebetteten Bildern, Schriften oder Überresten. Wenn nicht – wenn der Text nur Teil eines Bildes ist –, hast du einen Scan, und das Herunterrechnen dieser Seitenbilder ist dein größter Hebel.
Deins verkleinern, und zwar privat
Die gute Nachricht ist, dass das Beheben all dessen nicht erfordert, dein Dokument irgendwohin hochzuladen. Der FileShrinking-PDF-Kompressor läuft vollständig in deinem Browser, sodass ein vertraulicher Vertrag oder ein gescannter Ausweis dein Gerät nie verlässt: Er wird lokal verarbeitet und es wird nichts an einen Server gesendet. Fang damit bei jedem großen PDF an; wenn du ein Dokument aus deinen eigenen Fotos zusammenstellst, verkleinere sie zuerst mit dem JPEG-Kompressor, damit der zusätzliche Ballast gar nicht erst hineingelangt. Mit diesen beiden kommen die meisten überdimensionierten PDFs in einem einzigen Durchlauf auf eine handhabbare, E-Mail-taugliche Größe.