In diesem Artikel
Häufig werden wir von unseren Kunden gefragt: „Was soll ich machen – PDF/A-1 oder PDF/A-2?“ Dieser Frage wollen wir in diesem Beitrag nachgehen.
Die ISO Norm PDF/A-1 erschien 2005. Ziel war die gezielte Eingrenzung des Funktionsumfangs von PDF, sodass normkonforme Dateien langzeitarchivfähig sind. PDF wurde damals noch über eine Adobe-Referenz definiert. Mit PDF/A sollte also keine neue PDF-Referenz erstellt werden. Stattdessen wurden Empfehlungen als verpflichtend gekennzeichnet und Unklarheiten durch Einschränkungen geklärt, z.B. wurden transparente Objekte verboten.
Folgende Anforderungen stellt PDF/A
- Basierend auf PDF-Referenz 1.4
- Schriften einbetten
- Farbe eindeutig angeben
- Formulare, Kommentare, Notizen beschränkt zulässig
- Keine Multimedia-Objekte enthalten
- Keine eingebetteten Dateien
- Komprimierung nur für ausgewählte Objekte
- Kompression: kein LZW oder JPEG2000
- Keine Verschlüsselung
- keine durchscheinenden (transparenten) Objekte
- keine Ebenen (optional Content)
- Regeln für Metadaten auf der Grundlage von XMP
- PDF/A muss sich als solches ausweisen
2011 erschien der 2. Teil der Norm: PDF/A-2.
Wichtigste Neuerung war sicherlich die Tatsache, dass dieser Normteil jetzt auf PDF als ISO-Norm aufbauen konnte, der ISO 32000-1 (entspricht PDF 1.7). Auch die implizit mit geltende XMP Definition von Adobe war zwischenzeitlich zur ISO-Norm geworden. Durch die Weiterentwicklung des PDF-Formats konnten auch neuere Funktionen für PDF/A zugelassen werden. Dazu zählen zum Besipiel die OpenType Fonts, die JPEG2000-Bildkomprimierung und neuere Kommentararten.
In der ursprünglichen PDF-Referenz waren Transparenzen ungenau beschrieben. In der PDF ISO Norm sind sie jetzt so präzise, dass sie auch im Langzeit-PDF gefahrlos genutzt werden können. PDF/A-2 lässt also Transparenzen zu. Darum muss man sich bei der PDF/A Erzeugung nicht mehr kümmern.
PDF/A-1 hatte wegen der Basis PDF 1.4 eine Größenbeschränkung von 200 Inch = 5,08 m. Das war für viele Anwendungen zu klein. Eine Skalierung bei der PDF/A Erzeugung war der Work-Around. In der PDF/A Datei selbst war die Originalgröße dann aber nicht mehr bekannt. Mit PDF/A-2 kann man nun einen standardmäßig eingebauten Skalierungsfaktor nutzen, die User-Units. Damit sind jetzt Ausdehnungen von rund 300 km möglich.
Früher wurde im PDF/A häufig die Nutzbarkeit von Ebenen im PDF vermisst. Diese PDF-Funktion ist jetzt ebenfalls besser genormt: man muss eine Ebene als default-Ebene kennzeichnen. Dann kann man Ebenen, die z.B. bei der Konvertierung aus CAD-Modellen hilfreich mit dabei sind, auch wirklich nutzen.
PDF/A-1 machte keine Aussagen zu digitalen Signaturen. Dadurch waren diese schon immer zulässig. Und da PDF von Haus aus die handlichen eingebetteten Signaturen ermöglicht, wurde diese Funktion auch gern genutzt. Aber erst PDF/A-2 beinhaltet den Bezug auf Signaturnormen, sodass hier Fehler bei der Verwendung von Signaturen für die Langzeitarchivierung ausgeschlossen sind.
Eine weitere wichtige Neuerung war die Möglichkeit zum Einbetten von anderen Dateien. Wenn diese Dateien selbst wieder PDF/A-konform sind, kann dieses Feature genutzt werden.
2013 erschien der 3. Teil der Norm: PDF/A-3.
Einzige Neuerung ist hier die Möglichkeit, beliebige Dateien einzubetten. Man muss nur eine Kennzeichnung vornehmen, in welchem Verhältnis die eingebetteten Dateien zum Hüllen-PDF/A-3 stehen: Vorgängerversion oder andere Darstellung.
PDF/A-3 garantiert in keiner Weise irgendeine Qualität der eingebetteten Dateien. Dazu muss man sich selbst Vorschriften auferlegen, um nicht einen Wildwuchs zu bekommen. Für die Möglichkeit, beliebige Dateien in PDF/A-3 zu verpacken, gibt es aber zahlreiche nützliche Anwendungen:
- 2D PDF-Ansichten einer Konstruktion mit eingelagerter originaler 3D Geometrie
- Rechnung als PDF und eingelagerte Rechnungsdaten als XML
- Ursprünglich vorhandene non-PDF/A Datei aber mit gültiger digitaler Signatur eingebettet in der daraus abgeleiteten PDF/A Datei
Und was hat es mit den Leveln auf sich?
PDF/A-1 gibt es mit den Leveln a und b. Ab PDF/A-2 gibt es auch den Level u.
Level b ist der niedrigste, garantiert aber bereits die eindeutige visuelle Reproduzierbarkeit des PDFs. Dieser Level ist in der Regel ausreichend. Häufig kann bei schlechten Quellen auch kein höherer Level erreicht werden.
Level u stellt zusätzlich die Forderung auf, dass alle Zeichen in der Datei zusätzlich intern ihren Unicodenamen besitzen. Wohl gemerkt: wer Unicode benötigt, der kann das auch mit dem Level b tun. Er muss dort eben nur einen Unicode Font verwenden.
Level a ist die vollständige Norm. Hier kommen Forderungen nach automatischer Durchsuchbarkeit hinzu. Objekte: wie Überschriften, Bilder, Indexe müssen als solche gekennzeichnet sein. Hier wird der erste Schritt in Richtung PDF/UA gemacht.
Lange ließ sie auf sich warten: die Normung von 3D-Objekten in PDF unter dem Aspekt der Langzeitarchivierung. Der Teil 4 der PDF/A-Norm wurde Ende 2020 frei gegeben.
Nunmehr sind die bereits über PDF genormten 3D Formate U3D und PRC in einer PDF/A-Datei erlaubt. Die von Kunden ersehnten Formate JT und STEP – selber bereits hinreichend genormt – müssen noch etwas darauf warten, im Datenstrom von PDF erscheinen zu dürfen.
Die möglichen Level der Norm wurden drastisch geändert: man unterscheidet nur noch nach f für flat und e für engineering.
Die PDF/E-Norm wurde gleichzeitig unnötig und wird nicht weiter fortgesetzt.