Wie können wir das Internet archivieren?

Die Deutsche Nationalbibliothek (DNB) hat den Auftrag, das kulturelle und wissenschaftliche Erbe Deutschlands zu sammeln. Dazu gehören mittlerweile nicht mehr nur Druck- und Medienwerke, die in und über Deutschland erscheinen, sondern auch Publikationen in öffentlichen Netzen – sprich: das Internet. Bislang sammelt die DNB ausgewählte Internetadressen sowie Webseiten zu bestimmten Ereignissen (z.B. Wahlen, Jahrestage, Fußball-Weltmeisterschaften). Doch genügt das? Wie kann das Sammelprofil im Bereich Webarchivierung erweitert werden? Ein Projektseminar der Mainzer Buchwissenschaft hat sich damit auseinandergesetzt.

Klar war von Beginn an: die schiere Menge der im Internet erscheinenden Inhalte lässt die vollständige Archivierung nicht zu, die im analogen Bereich angestrebt wird.  Darum musste die Forschungsfrage lauten: Auf welche Inhalte möchten Nutzer in 20, 50 oder 100 Jahren noch zugreifen können? Die beteiligten Studierenden entschieden, mit einer standardisierten Umfrage über unterschiedlichste Verteilerlisten an die Nutzer von Morgen heranzutreten: Studierende und junge Akademiker. Innerhalb von 3 Wochen lagen knapp 600 komplett ausgefüllte Fragebögen vor, die detailliert ausgewertet wurden.

Erstaunlich ist die Diskrepanz zwischen der tatsächlichen Nutzung digitaler Medien und der Bewertung ihrer Archivwürdigkeit: Sind etwa eBooks, Enhanced eBooks oder ePapers nicht übermäßig genutzt, so werden diese an die analoge Form angelehnten Medien überproportional für archivwürdig gehalten. Für die eher flüchtig genutzten Kanäle wie soziale Medien, Streaming-Dienste oder Apps war dies nicht unbedingt der Fall. Ähnliches war im Speziellen bei der Frage nach der Nutzung von Webseiten zu beobachten: eher pragmatisch genutzte Seiten, wie Shopping- und Buchungsportale oder Firmenwebseiten wurden für weitaus weniger archivwürdig gehalten als die Seiten öffentlicher Einrichtungen oder Nachrichtenseiten. Offenbar gilt: je schneller und pragmatischer Webseiten genutzt werden desto unwichtiger wird die Archivierung bewertet. Dass hier die Art der Nutzung als Kulturtechnik interessant und archivierungswürdig sein könnte, scheint für die Nutzer kein Kriterium für den Sammelauftrag der DNB zu sein. Doch wer zeigt sich hierfür zuständig? Eine Frage, derer die Politik sich sicherlich annehmen müsste.

Bei der Einzelauswertung fällt einmal mehr auf, dass die eher traditionellen Seiten (öffentliche Einrichtungen, Nachrichtenportale, Wikis) möglichst vollständig und in einem engen Turnus (wöchentlich-monatlich, bei Nachrichtenseiten sogar täglich) und in möglichst originalgetreuer Form  gesammelt werden sollten. Dazu gehören das Funktionieren von Links und eingebetteten Dateien sowie die grafische Darstellung. Verwunderlich ist das Ergebnis bei der Bewertung von Selfpublishing-Portalen, die ja eine deutliche Nähe zu traditionellen Publikationsformen haben: das Bedürfnis, hier einen vollständigen Überblick abzubilden ist nicht ausgesprochen groß. Nur etwas über die Hälfte aller Befragten spricht sich überhaupt für eine Sammlung aus, für rund ein Viertel genügt eine repräsentative Auswahl ohne besondere Gewichtung qualitativer Kriterien. Bezüglich Firmenseiten, Alltagsblogs und sonstigen Webseiten genügt es den Umfrageteilnehmern, später im Webarchiv eine repräsentative Auswahl zur Verfügung zu haben, die maximal monatlich eingesammelt werden sollte. Qualitätskriterien sind hier zweitrangig. Shopping- und Buchungsportale werden so gut wie nicht archivwürdig gehalten: Dreiviertel der Befragten halten eine Sammlung für unnötig.

Ein ereignisbezogenes Sammeln wurde von 80 Prozent der Umfrageteilnehmer als sinnvoll bewertet. Die im Freitextfeld genannten Themen, die zu sammeln sind, haben hauptsächlich Nachrichtenwert, z.B. Wahlen, Sportveranstaltungen, Terroranschläge oder Naturkatastrophen.

Darüber hinaus sind Mainzer Buchwissenschaft und Deutsche Nationalbibliothek daran interessiert, die Diskussionen zu der Frage ‚Wie soll das Sammelprofil der Deutschen Nationalbibliothek bei Webseiten aussehen?‘ auf diesem Blog fortzusetzen. Interessierte Fachkolleginnen und –kollegen, der Wissenschaftsbereich, die Allgemeinheit sind ausdrücklich eingeladen, sich an dieser Diskussion zu beteiligen – wir freuen uns auf einen lebhaften Gedankenaustausch.Auswertung Homepage-page-001Auswertung Homepage-page-002Auswertung Homepage-page-003Auswertung Homepage-page-004Auswertung Homepage-page-005Auswertung Homepage-page-006Auswertung Homepage-page-007Auswertung Homepage-page-008Auswertung Homepage-page-009Auswertung Homepage-page-010Auswertung Homepage-page-011Auswertung Homepage-page-012Auswertung Homepage-page-013Auswertung Homepage-page-014Auswertung Homepage-page-015Auswertung Homepage-page-016Auswertung Homepage-page-017Auswertung Homepage-page-018Auswertung Homepage-page-019Auswertung Homepage-page-020Auswertung Homepage-page-021Auswertung Homepage-page-022Auswertung Homepage-page-023Auswertung Homepage-page-024Auswertung Homepage-page-025Auswertung Homepage-page-026Auswertung Homepage-page-027

Auswertung Homepage (PDF) 

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s