Preservation Policy der Technischen Informationsbibliothek (TIB)
Version 1.5 // Stand: 28. Juni 2024 (zuletzt reviewed am 28. Juni 2024)
1. Einleitung
Die Technische Informationsbibliothek (TIB) ist die Deutsche Zentrale Fachbibliothek für Technik sowie Architektur, Chemie, Informatik, Mathematik und Physik. Sie versorgt vor allem die nationale wie internationale Forschung und Industrie mit Literatur und Information. Als weltweit größte Fachbibliothek in ihren Bereichen trägt sie Verantwortung, das verzeichnete Wissen zu erhalten und aktuelle Informationen unabhängig von Ort und Zeit heute und in Zukunft bereitzustellen.
Die TIB ist Mitglied der Leibniz-Gemeinschaft.
Die TIB, ZBW – Leibniz-Informationszentrum Wirtschaft und ZB MED – Informationszentrum Lebenswissenschaften bilden zusammen den Verbund der Zentralen Fachbibliotheken in Deutschland. Die Partnerbibliotheken betreiben zusammen ein digitales Langzeitarchivierungssystem, um die Langzeitverfügbarkeit ihrer Bestände sicherzustellen und haben 2014 eine konsortiale Preservation Policy verabschiedet. Die vorliegende institutionelle Preservation Policy der TIB konkretisiert die digitale Langzeitarchivierung an der TIB und richtet sich an Mitarbeiter:innen, Datenproduzent:innen und Nutzer:innen. Die Policy wird jährlich auf Aktualisierungsbedarf geprüft. Detaillierte Informationen werden auf den Internetseiten der digitalen Langzeitarchivierung der TIB zur Verfügung gestellt.
2. Mission
2.1 Aufgabe
Als Deutsche Zentrale Fachbibliothek für Technik sowie Architektur, Chemie, Informatik, Mathematik und Physik sichert die TIB mit ihren zukunftsgerichteten Dienstleistungen die infrastrukturellen Voraussetzungen einer qualitativ hochwertigen Informations- und Literaturversorgung für die nationale Wissenschaft, Forschung, Lehre und Praxis.
Der weltweit einmalige Bestand an technisch-naturwissenschaftlichen Fach- und Forschungsinformationen bildet das Fundament der Dienstleistungen der TIB. Diesen Bestand in seiner Einzigartigkeit auszubauen, als kulturelles Erbe zu bewahren, den Zugang durch verlässliche Informationsinfrastruktur zu erleichtern und entsprechende Services durch eigene Forschung zu optimieren, bildet den Kern der Aktivitäten der TIB.
Die Aufgabe der Langzeitarchivierung ist in der Strategie der TIB dokumentiert.
Die TIB ist Depotbibliothek für Forschungsberichte für verschiedene Ministerien und forschungsfördernde Institutionen, darunter das Bundesministerium für Bildung und Forschung (BMBF) und das Bundesministerium für Wirtschaft und Energie (BMWi).
Die TIB archiviert die Hochschulschriften der Fakultäten der Leibniz Universität Hannover sowie die Objekte des institutionellen Repositoriums der Leibniz Universität Hannover.
2.2 Zielgruppen
Die Zielgruppen des digitalen Langzeitarchivs unterteilen sich in Mitarbeiter:innen, Datenproduzent:innen und Nutzer:innen.
Mitarbeiter:innen, Datenproduzent:innen und Nutzer:innen geben Objekte an die TIB ab.
Die Zielgruppe Mitarbeiter:innen der TIB umfasst insbesondere Mitarbeiter:innen der digitalen Langzeitarchivierung sowie Mitarbeiter:innen, die mit dem digitalen Langzeitarchivierungssystem Rosetta arbeiten.
Die Nutzer:innen des digitalen Langzeitarchivs entsprechen den Nutzergruppen der TIB: Angehörige der Leibniz Universität Hannover, akademische und außeruniversitäre Forschungseinrichtungen, die interessierte Öffentlichkeit und die Wirtschaft.
Die Anforderungen der Zielgruppen an das digitale Langzeitarchivierungssystem werden berücksichtigt.
2.3 Sammlungsprofil und Selektion
Als Zentrale Fachbibliothek für Technik sowie Architektur, Chemie, Informatik, Mathematik und Physik hat die TIB die Aufgabe, den verfügbaren Content in diesen Fachgebieten zu erwerben, zu erschließen, ihn überregional Forschung und Lehre bereitzustellen und dessen langfristige Zugänglichkeit zu gewährleisten. Die TIB verfolgt eine „e-preferred“-Strategie und erwirbt zunehmend Publikationen, die ausschließlich digital verfügbar sind. Der Anteil nicht-textueller Medien wächst stetig.
Die TIB verfolgt das Ziel, für ihren Bestand eine besitzende Bibliothek zu sein.
Unter Umständen besteht ein Objekt aus mehr als einer Repräsentation. Kriterien für die Auswahl der Repräsentationen sind wie folgt:
- Wenn es möglich ist, wird die vom Produzenten abgelieferte Originaldatei als Repräsentation MASTER erfasst.
- Wenn es eine Nutzungskopie auf einer Nutzungsplattform gibt, wird die Nutzungskopie als Repräsentation DERIVATIVE COPY erfasst.
- Wenn es eine bearbeitete Kopie des MASTERS gibt, die für die Erhaltung der Objekte von Nutzen ist – zum Beispiel weil die Reihenfolge von Einzeldateien abgebildet wird – wird diese als MODIFIED MASTER erfasst.
Weitere Repräsentationen können in Abhängigkeit vom Bestand archiviert werden.
Bei der Priorisierung für die Langzeitarchivierung werden neben dem Sammelauftrag auch Kriterien wie der Erhaltungszustand der Datenträger und Besonderheiten einzelner Teilbestände wie der Alleinbesitz in Deutschland/ Europa/weltweit berücksichtigt.
3. Prinzipien der digitalen Langzeitarchivierung
Die TIB ist für den Erhalt der Langzeitverfügbarkeit ihrer Bestände verantwortlich. Zu diesem Zweck definiert die TIB folgende Prinzipien für die digitale Langzeitarchivierung:
3.1 Preservation Watch
Aktuelle technische Entwicklungen müssen fortlaufend beobachtet werden, um auf drohende Formatobsoleszenz, neue Erwartungen der Datenkonsumenten sowie neue Technologien und Stand-der-Technik-Entwicklungen rechtzeitig reagieren zu können.
Die TIB engagiert sich auf nationaler und internationaler Ebene als Mitglied in den Langzeitarchivierungsnetzwerken nestor und Open Preservation Foundation (OPF) und fördert die fachliche Kompetenz der Mitarbeiter:innen durch Teilnahme an Workshops, Konferenzen und den kontinuierlichen Austausch mit ihren Partnern.
3.2 Metadaten
Metadaten gewährleisten im Kontext der digitalen Langzeitarchivierung nicht nur die langfristige Auffindbarkeit eines Objekts via deskriptiver Informationen. Ferner werden in den Metadaten langzeitarchivierungsrelevante Informationen über technische Eigenschaften des digitalen Objekts sowie über dessen Entstehungsprozess erfasst und alle Änderungen an einem Objekt dokumentiert. Die Metadaten werden mit dem Objekt in einem logischen AIP gespeichert.
Neben den deskriptiven Metadaten aus dem Katalog oder anderen Nachweissystemen erfasst die TIB technische, administrative, rechtliche, strukturelle und prozessbezogene Metadaten. Dabei werden die Metadatenstandards Dublin Core, das PREMIS-basierte DNX und METS verwendet.
3.3 Rechtliche Kompatibilität
Die TIB beachtet die geltenden rechtlichen Bestimmungen und holt von den Produzent:innen die Erlaubnis zur Langzeitarchivierung ein. Werden die entsprechenden Rechte für ein Objekt nicht erteilt, erfolgt die Langzeitarchivierung auf Basis der gesetzlichen Regelungen.
3.4 Preservation Level
Es gibt verschiedene Preservation Level, die die Qualität der Langzeitarchivierungsmaßnahmen beschreiben:
- Bitstream Preservation: Hierbei handelt es sich um die bloße Speicherung und Erhaltung des Bitstroms durch Überwachung und Austausch der Speichermedien. Es werden keine Maßnahmen zum Erhalt auf logischer Dateiformatebene unterstützt. Die Bitstream Preservation ist das niedrigste Erhaltungslevel.
- Logical Preservation: Die langfristige Verfügbar- und Lesbarkeit der Objekte auf Dateiformatebene ist sichergestellt. Mit der Logical Preservation wird die Ausführbarkeit der Objekte sichergestellt.
- Semantic Preservation: Semantic Preservation stellt die langfristige Interpretierbarkeit auf inhaltlicher Ebene sicher. Benötigte Kontextinformationen werden in begleitenden Metadaten (Representation Information) erfasst und regelmäßig auf Aktualität überprüft. Analog zur Migration auf logischer Ebene können Metadaten auf kontextueller Ebene migriert und versioniert werden.
Die TIB strebt für die Objekte, für die sie langzeitarchivierungspflichtig ist, die Langzeitarchivierung auf allen Ebenen an.
Für Objekte mit Passwortschutz, Digital Rights Management, Signaturen und anderen Schutzmaßnahmen, die Bestandserhaltungsmaßnahmen verhindern, kann nur Bitstream Preservation angeboten werden.
3.5 Erhalt der Datenintegrität
Der Bitstrom eines gespeicherten Objekts muss vor ungewollten Änderungen durch Hardwaredefekte, Kopierfehler, menschliche Bedienfehler und Speichermedienverschleiß geschützt werden.
Die TIB betreibt ein eigenes Rechenzentrum und folgt dabei der Best Practice:
- Die Datenintegrität wird mit Prüfsummen und Speicherverwaltungsprozessen sichergestellt.
- Die TIB speichert die Daten redundant auf getrennten Speichermedien.
- Die Speichermedien werden überwacht und bei Bedarf ausgetauscht.
3.6 Erhalt der Authentizität
Die TIB bewahrt die Originaldatei unverändert als Archivmaster.
Änderungen erfolgen grundsätzlich an einer Kopie der Originaldateien. Eine Änderung liegt vor, wenn zum Beispiel:
- eine Reihenfolge der Originaldateien festgelegt wird,
- das Objekt vertrauliche Bestandteile enthält und diese entfernt werden,
- ein Titelblatt eingefügt wird oder
- eine verändernde Bestandserhaltungsmaßnahme wie Migration durchgeführt wird.
Die modifizierte Kopie wird zusätzlich zum Archivmaster als modifizierter Archivmaster gespeichert. Bei Änderungen an einem AIP wird das AIP versioniert und eine neue METS-Datei erzeugt. Sämtliche Änderungen an einem Objekt werden in den Metadaten dokumentiert.
3.7 Erhalt der Vollständigkeit
Die Objekte werden vollständig langzeitarchiviert. Struktur und Inhalt der Archivmaster werden vollständig übernommen.
3.8 Erhalt der Lesbarkeit
Die TIB hat für verschiedene Publikationsarten Formatempfehlungen veröffentlicht (Hochschulschriften, Deutsche Forschungsberichte, audiovisuelle Medien). Für die Hochschulschriften sind die Formatvorgaben verbindlich.
Das digitale Langzeitarchivierungssystem verfügt über ein Preservation-Planning-Modul, mit dem Preservation Plans geschrieben und analysiert sowie Preservation Actions durchgeführt werden können.
Die TIB erhält die Nutzbarkeit der Objekte neben der Erhaltung des Bitstroms durch die Bestandserhaltungsstrategien Migration und Emulation. Die Bestandserhaltungsmaßnahmen werden mit Preservation Plans individuell an die verschiedenen Format-, Sammlungs- und Objektgruppen angepasst.
3.9 Erhalt der Auffindbarkeit
Objekte müssen wieder auffindbar sein.
Objekte in Rosetta erhalten eine systeminterne ID auf folgenden Ebenen:
- Information Package (SIP-ID)
- Intellectual Entity (IE-ID)
- Repräsentation (REP-ID)
- File (File-ID)
Ausgewählte Objekte erhalten einen Digital Object Identifier (DOI). Dissertationen der Leibniz Universität Hannover erhalten eine URN (Uniform Resource Name).
3.10 Wahrung der Vertraulichkeit
Die Nutzungsrechte für ein Objekt werden in Rosetta erfasst. Der Lizenztext wird gespeichert und in den Metadaten mit dem Objekt verlinkt. Die Access Rights werden der Lizenzvereinbarung entsprechend zugewiesen. Nutzungsbeschränkungen werden dabei berücksichtigt.
- Objekte mit Sperrfrist erhalten bis zum Ablauf der Sperrfrist eine vollständige Zugriffssperre.
- Auf Objekte mit eingeschränktem Zugriff kann nur zugegriffen werden, wenn die Zugangsvoraussetzungen erfüllt sind (s. 3.12 Zugriff und Nutzung).
3.11 Dokumentation der Prozesse
Die TIB hat die Prozesse der digitalen Langzeitarchivierung dokumentiert.
3.12 Zugriff und Nutzung
Nutzungsszenario 1: Zugriff von außerhalb auf Nutzungskopien auf Nutzungsplattformen
Der Zugriff durch die Produzent:innen und Nutzer:innen auf die digitalen Objekte erfolgt derzeit nicht auf die in Rosetta gespeicherten Nutzungskopien. Die Katalogisate oder andere Nachweis- und Nutzungsinstrumente enthalten einen Link auf die Objekte, die darüber den Nutzer:innen zur Verfügung stehen. Die TIB ist bestrebt, den Nutzer:innen unter Beachtung der rechtlichen Beschränkungen komfortable Zugriffsmöglichkeiten anzubieten. Aus rechtlichen Gründen stehen aber nicht alle Objekte der TIB online zur Verfügung. Es existieren folgende Nutzungsszenarien:
- frei im Online-Zugriff verfügbar
- Zugriff nur mit Campus-Lizenz
- Zugriff nur für registrierte Nutzer:innen
- Zugriff nur vor Ort im Lesesaal
- Zugriff auf einen Datenträger oder auf eine Druckausgabe
Nutzungsszenario 2: Interner Zugriff auf Nutzungskopien in Rosetta
Der interne Zugriff auf Nutzungskopien ist abhängig von einem Trigger-Ereignis, zum Beispiel:
- Die für die Nutzer:innen zugängliche Nutzungskopie ist nicht mehr vorhanden.
- Die für die Nutzer:innen zugängliche Nutzungskopie funktioniert nicht mehr.
Im Trigger-Fall wird das entsprechende AIP im digitalen Langzeitarchivierungssystem gesucht. Die im AIP hinterlegte Nutzungskopie wird als Kopie aus Rosetta exportiert. Diese Kopie wird an die entsprechende Nutzungsplattform übergeben.
Nutzungsszenario 3: Nutzungskopien werden von Rosetta an eine Nutzungsplattform geliefert
Für bestimmte Workflows können Objekte von Rosetta an die jeweilige Nutzungsplattform geliefert werden.
4. Technische Infrastruktur
Die technische Infrastruktur der TIB entspricht den Anforderungen des OAIS-Modells. Die erforderlichen Prozesse sind OAIS-konform umgesetzt und Reportfunktionen sind vorhanden.
Die TIB betreibt in einem eigenen Rechenzentrum den Archivspeicher.
Das digitale Langzeitarchivierungssystem Rosetta erfüllt die Anforderungen an ein digitales Langzeitarchiv:
- Ingest (inklusive Deposit)
- Data Management
- Archival Storage
- Administration
- Preservation Planning
- Access
5. Verantwortlichkeiten
Die digitale Langzeitarchivierung ist keine befristete Aufgabe, sondern ein kontinuierlicher, wiederkehrender Prozess. Die digitale Langzeitarchivierung ist Bestandteil der Organisationsstruktur und der Haushaltsplanung der TIB. Die Leitung des Bereichs Bestandserhaltung und Langzeitarchivierung ist für alle Fragen zum Erhalt der langfristigen Verfügbarkeit verantwortlich.
Wer hilft weiter?
Thomas Bähr
Bestandserhaltung und Langzeitarchivierung