Erzeugen Sie PDF/A-Dokumente für die Langzeitarchivierung

PDF/A-Erstellung

PDF/A – was ist das?

PDF/A ist eine ISO Norm, die die langfristige identische Reproduzierbarkeit von PDF gewährleistet. In manchen Branchen sind Archivierungsfristen von bis zu 100 Jahren vorgeschrieben. Und im Zeitraum der Archivierung will man keinen Wechsel des Dateiformats vornehmen.

Diese Sicherheit gibt PDF/A.

Aber nicht nur für die Langzeitarchivierung ist es wichtig, dass PDF-Dateien immer gleich aussehen. Auch beim zeitnahen Ausdrucken eines Dokuments auf einem anderen System als dem des Autors, kann es vorkommen, dass das Ergebnis anders aussieht als „beabsichtigt“. Ein Effekt, den es zu verhindern gilt.

PDF/A-Konvertierung mit SEAL Systems

Als PDF/A-Spezialist konvertiert SEAL Systems Ihre Dokumente und Dateien aus diversen Applikationen und Systemen ins genormte Format. Insbesondere prüfen wir Ihre PDF-Dateien auf Konformität mit dem PDF/A-Regelwerk und passen Ihre Dateien gegebenenfalls an diese Norm an. Deswegen ist SEAL Systems auch aktives Mitglied im PDF Association e.V., der Vereinigung für digitale Dokumentenstandards.

Welche Vorteile bie‍tet PDF/A für die Archivierung?

„Wie erzeugt, so in 100 Jahren gedruckt.“ – die ISO Norm sichert die langfristige Reproduzierbarkeit.
PDF/A kann eine Vielzahl anderer Formate in sich vereinigen.
PDF/A ist durchsuchbar nach Texten.
Zusatzfunktionen wie Verschlagwortung und digitale Signaturen sind möglich.
PDF/A bildet die Vorstufe zur automatischen Lesbarkeit (Tagged PDF).
PDF/A erlaubt nun sogar die Einbindung von 3D-Inhalten aus dem Engineering-Umfeld.

Interesse geweckt?

Fordern Sie unverbindlich weitere Infor‍mationen an!

 

Was unterscheidet PDF/A vom normalen PDF?

Eine PDF/A-konforme Datei beinhaltet alle Teile, die für die eindeutige Reproduktion benötigt werden, in sich selbst. Die Datei ist vollständig und abgeschlossen. Weder Fonts, noch Farben oder Inhalt über Links werden außerhalb der Datei gespeichert. Ein Regelwerk unterstützt die interne Verschlagwortung der Dateien, sodass eine Zuordnung auch ohne ein ECM System möglich ist. Außerdem unterstützt eine PDF/A Datei den Anwender weitestgehend, wenn er Teile des Inhalts wieder entnehmen will. Und: Der interne Aufbau vermeidet externe Abhängigkeiten von Hardware (auch Bildschirm oder Drucker) und Betriebssystemen.

FAQ zu PDF/A-Konvertierung

Wie ist PDF/A eigentlich entstanden?

Die ISO Norm PDF/A-1 erschien 2005. Ziel war die gezielte Eingrenzung des Funktionsumfangs von PDF, sodass normkonforme Dateien langzeitarchivfähig sind. PDF wurde damals noch über die Adobe-Referenz definiert. Mit PDF/A sollte aber keine neue PDF-Referenz erstellt werden. Stattdessen wurde die bestehende PDF-Referenz „verkleinert“.

2011 kam dann der 2. Teil der Norm: PDF/A-2. Wichtigste Neuerung war sicherlich die Tatsache, dass dieser Normteil jetzt auf PDF als ISO Norm aufbauen konnte, der ISO 32000-1 (entspricht PDF 1.7). Auch die implizit mitgeltende XMP-Definition von Adobe war zwischenzeitlich zur ISO-Norm geworden. Durch die Weiterentwicklung des PDF-Formats konnten auch neuere Funktionen für PDF/A zugelassen werden. Dazu zählen z.B. die OpenType Fonts, die JPEG2000-Bildkomprimierung und neuere Kommentararten.

2013 erschien der 3. Teil der Norm: PDF/A-3. Einzige Neuerung ist hier die Möglichkeit, beliebige Dateien einzubetten. Es muss lediglich eine Kennzeichnung vorgenommen werden, in welchem Verhältnis die eingebetteten Dateien zum Hüllen-PDF/A-3 stehen: Vorgängerversion oder andere Darstellung.

Welches sind die wesentlichen Merkmale einer PDF/A Datei?

Schriftarten: Das wohl bekannteste Merkmal ist in diesem Zusammenhang wohl das Einbetten der verwendeten Schriften. Jede verwendete Schrift muss auch eingebettet werden. Soll gar der höchste Level a erreicht werden, so muss jedes Zeichen mit dem entsprechenden Unicode-Namen gekennzeichnet sein, auch wenn gar kein Unicode-Font verwendet wird.

Farben: Auch Farben sollte man nicht dem Zufall oder dem Willen des jeweilig verwendeten Druckers überlassen. Es gibt allgemeingültige Farbmodelle – das hat nichts mit PDF zu tun. Diese sollten verwendet werden. Und wenn das nicht geht, dann sollte man der PDF-Datei mitgeben, auf welchem Gerät sie vorzugsweise ausgegeben werden sollte. Dann kann später noch eine Umrechnung auf ein allgemeingültiges Farbmodell erfolgen.

Verschlüsselung: PDF/A erlaubt generell keine Verschlüsselung. Auch ist im Gegensatz zum normalen PDF eine Komprimierung nicht durchgängig erlaubt. Bilder können mit einem genormten Verfahren – wie Tiff, JPEG und ab PDF/A-2 auch JPEG2000 – komprimiert werden. Mehr ist nicht möglich, denn auf den Inhalt einer PDF/A Datei soll so einfach wie möglich zugegriffen werden können. Der Schutz der Datei gegen unkontrolliertes Ändern muss durch ein Verwaltungssystem (DMS) erfolgen. Bei einer Verteilung von Dokumenten bietet sich außerdem die Verwendung eines digitalen Rechtemanagements (DRM) an. Da dieses die Dateien aber verschlüsselt, muss immer noch ein genormtes PDF/A intern vorrätig gehalten werden.

Digitale Signaturen: Dass eine PDF-Datei ab einem bestimmten Zeitpunkt nicht mehr geändert wurde, kann durch digitale Signaturen bewiesen werden. PDF/A-1 machte keine Aussagen zu digitalen Signaturen. Dadurch waren diese automatisch zulässig. Und da PDF von Haus aus die handlichen eingebetteten Signaturen ermöglicht, wurde diese Funktion auch gern genutzt. Aber erst PDF/A-2 beinhaltet den Bezug auf Signaturnormen, sodass hier Fehler bei der Verwendung von Signaturen für die Langzeitarchivierung ausgeschlossen sind.

Transparenzen: In der ursprünglichen PDF-Referenz waren Transparenzen ungenau beschrieben. In der PDF ISO Norm sind sie jetzt so präzise, dass sie auch im Langzeit-PDF gefahrlos genutzt werden können. Ab PDF/A-2 sind daher Transparenzen zulässig. Die Möglichkeit, Transparenzen nutzen zu können, ist ein wichtiger Grund, auf PDF/A-2 umzustellen, wenn man vorher bereits PDF/A-1 erzeugt hat.

Skalierungsmöglichkeiten: PDF/A-1 hatte wegen der Basis PDF 1.4 eine Größenbeschränkung von 200 Inch = 5,08m. Das war für viele Anwendungen zu klein. Eine Skalierung bei der PDF/A Erzeugung war der Work-Around. In der PDF/A Datei selbst war die Originalgröße dann aber nicht mehr bekannt. Mit PDF/A-2 kann nun ein standardmäßig eingebauter Skalierungsfaktor genutzt werden, die sogenannten User-Units. Damit sind jetzt Ausdehnungen von rund 300 km möglich.

Ebenen: Früher wurde im PDF/A häufig die Nutzbarkeit von Ebenen im PDF vermisst. Diese PDF-Funktion ist jetzt ebenfalls besser genormt: eine Ebene muss als default-Ebene gekennzeichnet werden. Dann können Ebenen, die z.B. bei der Konvertierung aus CAD-Modellen hilfreich sind, auch wirklich genutzt werden.

Einbettung von Dateien: Eine wichtige Neuerung von PDF/A-2 war die Möglichkeit zum Einbetten von anderen Dateien. Wenn diese Dateien selbst wieder PDF/A-konform sind, kann dieses Feature verwendet werden. Mit PDF/A-3 lassen sich sogar beliebige Dateien einbetten. PDF/A-3 garantiert aber in keiner Weise irgendeine Qualität der eingebetteten Dateien. Dazu muss man sich selbst Vorschriften auferlegen, um nicht einen Wildwuchs zu bekommen. Für die Möglichkeit, beliebige Dateien in PDF/A-3 zu verpacken, gibt es aber zahlreiche Anwendungen:

  • 2D PDF Ansichten einer Konstruktion mit eingelagerter originaler 3D Geometrie
  • Rechnung als PDF und eingelagerte Rechnungsdaten als XML (ZUGFeRD)
  • Ursprünglich vorhandene non-PDF/A Datei aber mit gültiger digitaler Signatur eingebettet in der daraus abgeleiteten PDF/A Datei

Markierte Dateien: Adobe hat auch eine eigene Norm, die XMP Norm, geschaffen, um Dateien mittels XML Tags zu markieren. Eine so markierte Datei trägt die Information, wozu sie eigentlich dient, in sich selbst; eine Absicherung für den Ausfall des DMS Systems. XMP beinhaltet auch mehrere Schemata für Schlagwörter. Falls die Schlagwörter, die Sie gerne für Ihr PDF/A-Archiv verwenden wollen, nicht dabei sind, erstellen Sie einfach ein eigenes Schema und betten dieses in die PDF/A Datei ein.

Was hat es mit den PDF-Leveln auf sich?

PDF/A-1 gibt es mit den Leveln a und b. Ab PDF/A-2 gibt es auch den Level u.

Level b ist der niedrigste, garantiert aber bereits die eindeutige visuelle Reproduzierbarkeit des PDFs. Dieser Level ist in der Regel ausreichend. Häufig kann bei den vorhandenen Quellen auch gar kein höherer Level erreicht werden.

Level u stellt zusätzlich die Forderung auf, dass alle Zeichen in der Datei zusätzlich intern ihren Unicodenamen besitzen. Wohl gemerkt: wer Unicode benötigt, der kann das auch mit dem Level b tun. Er muss dort eben nur einen Unicode Font verwenden.

Level a ist die vollständige Norm. Hier kommen Forderungen nach automatischer Durchsuchbarkeit hinzu. Objekte: wie Überschriften, Bilder, Indexe müssen als solche gekennzeichnet sein. Hier wird ein erster Schritt in Richtung PDF/UA gemacht.