PDF/A – Ein Vergleich der Teilnormen

von  Dr. Uwe Wächter

Häufig werden wir von unseren Kunden gefragt: „Was soll ich machen – PDF/A-1 oder 2?“ Dieser Frage wollen wir heute nachgehen.

Die ISO Norm PDF/A-1 erschien 2005. Ziel war die gezielte Eingrenzung des Funktionsumfangs von PDF, sodass normkonforme Dateien langzeitarchivfähig sind. PDF wurde damals noch über eine Adobe Referenz definiert. Mit PDF/A sollte also keine neue PDF-Referenz erstellt werden. Stattdessen wurden Empfehlungen als verpflichtend gekennzeichnet und Unklarheiten durch Einschränkungen geklärt, z.B. wurden transparente Objekte verboten.

Folgende Anforderungen stellt PDF/A:

  • Basierend auf PDF Referenz 1.4
  • Schriften einbetten
  • Farbe eindeutig angeben
  • Formulare, Kommentare, Notizen beschränkt zulässig
  • Keine Multimedia-Objekte enthalten
  • Keine eingebetteten Dateien
  • Komprimierung nur für ausgewählte Objekte
  • Kompression: kein LZW oder JPEG2000
  • Keine Verschlüsselung
  • keine durchscheinenden (transparenten) Objekte
  • keine Ebenen (optional Content)
  • Regeln für Metadaten auf der Grundlage von XMP
  • PDF/A muss sich als solches ausweisen

 

2011 erschien der 2. Teil der Norm: PDF/A-2.

Wichtigste Neuerung war sicherlich die Tatsache, dass dieser Normteil jetzt auf PDF als ISO Norm aufbauen konnte, der ISO 32000-1 (entspricht PDF 1.7). Auch die implizit mit geltende XMP komposition3Definition von Adobe war zwischenzeitlich zur ISO-Norm geworden. Durch die Weiterentwicklung des PDF Formats konnten auch neuere Funktionen für PDF/A zugelassen werden. Dazu zählen z.B. die OpenType Fonts, die JPEG2000-Bildkomprimierung und neuere Kommentararten.

In der ursprünglichen PDF Referenz waren Transparenzen ungenau beschrieben. In der PDF ISO Norm sind sie jetzt so präzise, dass sie auch im Langzeit-PDF gefahrlos genutzt werden können. PDF/A-2 lässt also Transparenzen zu. Darum muss man sich bei der PDF/A Erzeugung nicht mehr kümmern.

PDF/A-1 hatte wegen der Basis PDF 1.4 eine Größenbeschränkung von 200 Inch = 5,08m. Das war für viele Anwendungen zu klein. Eine Skalierung bei der PDF/A Erzeugung war der Work-Around. In der PDF/A Datei selbst war die Originalgröße dann aber nicht mehr bekannt. Mit PDF/A-2 kann man nun einen standardmäßig eingebauten Skalierungsfaktor nutzen, die User-Units. Damit sind jetzt Ausdehnungen von rund 300 km möglich.

Früher wurde im PDF/A häufig die Nutzbarkeit von Ebenen im PDF vermisst. Diese PDF-Funktion ist jetzt ebenfalls besser genormt: man muss eine Ebene als default-Ebene kennzeichnen. Dann kann man Ebenen, die z.B. bei der Konvertierung aus CAD-Modellen hilfreich mit dabei sind, auch wirklich nutzen.

PDF/A-1 machte keine Aussagen zu digitalen Signaturen. Dadurch waren diese schon immer zulässig. Und da PDF von Haus aus die handlichen eingebetteten Signaturen ermöglicht, wurde diese Funktion auch gern genutzt. Aber erst PDF/A-2 beinhaltet den Bezug auf Signaturnormen, sodass hier Fehler bei der Verwendung von Signaturen für die Langzeitarchivierung ausgeschlossen sind.

Eine weitere wichtige Neuerung war die Möglichkeit zum Einbetten von anderen Dateien. Wenn diese Dateien selbst wieder PDF/A-konform sind, kann dieses Feature genutzt werden.

 

PDF_doppelt2013 erschien der 3. Teil der Norm: PDF/A-3.

Einzige Neuerung ist hier die Möglichkeit, beliebige Dateien einzubetten. Man muss nur eine Kennzeichnung vornehmen, in welchem Verhältnis die eingebetteten Dateien zum Hüllen-PDF/A-3 stehen: Vorgängerversion oder andere Darstellung.

PDF/A-3 garantiert in keiner Weise irgendeine Qualität der eingebetteten Dateien. Dazu muss man sich selbst Vorschriften auferlegen, um nicht einen Wildwuchs zu bekommen. Für die Möglichkeit, beliebige Dateien in PDF/A-3 zu verpacken, gibt es aber zahlreiche Anwendungen:

  • 2D PDF Ansichten einer Konstruktion mit eingelagerter originaler 3D Geometrie
  • Rechnung als PDF und eingelagerte Rechnungsdaten als XML (ZUGFeRD)
  • Ursprünglich vorhandene non-PDF/A Datei aber mit gültiger digitaler Signatur eingebettet in der daraus abgeleiteten PDF/A Datei

 

Und was hat es mit den Leveln auf sich?

PDF/A-1 gibt es mit den Leveln a und b. Ab PDF/A-2 gibt es auch den Level u.

Level b ist der niedrigste, garantiert aber bereits die eindeutige visuelle Reproduzierbarkeit des PDFs. Dieser Level ist in der Regel ausreichend. Häufig kann bei den vorhandenen Quellen auch gar kein höherer Level erreicht werden.

Level u stellt zusätzlich die Forderung auf, dass alle Zeichen in der Datei zusätzlich intern ihren Unicodenamen besitzen. Wohl gemerkt: wer Unicode benötigt, der kann das auch mit dem Level b tun. Er muss dort eben nur einen Unicode Font verwenden.

Level a ist die vollständige Norm. Hier kommen Forderungen nach automatischer Durchsuchbarkeit hinzu. Objekte: wie Überschriften, Bilder, Indexe müssen als solche gekennzeichnet sein. Hier wird der erste Schritt in Richtung PDF/UA gemacht.

Sie haben Fragen? Sprechen Sie mich an!

Dr. Uwe Wächter
uwe.waechter@sealsystems.de

 

Teilen

Hinterlassen Sie eine Antwort

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert. *

* = Pflichtfeld

  • Blog-Kategorien

  • Anstehende Veranstaltungen

    1. Siemens PLM Connection

      4. Juli 2017 - 5. Juli 2017
    2. SAP for Utilities

      10. September 2017 um 08:00 - 14. September 2017 um 17:00
    3. TechEd

      25. September 2017 - 29. September 2017
    4. DSAG Jahreskongress

      26. September 2017 - 28. September 2017
    5. SEAL Systems Schulungstage

      7. November 2017 - 9. November 2017