Time Machine im Rennen um ein europäisches FET Flagship

Mehr entdecken
Frédéric Kaplan
Archive
Digitalisierung
europäisches Kulturgut

Das 2012 gestartete Projekt Venice Time Machine erreichte 2018 seine Halbzeit mit zwei wichtigen Etappen: einerseits dem Wunsch, dem Konzept der Time Machine eine europäische Dimension zu verleihen, und andererseits der Freigabe der über zwei Millionen bereits gescannter Dokumente für die Öffentlichkeit und die Historiker.

«Alles, was vor dem Jahr 2000 war, existiert nicht, weil es kein Medium für den Zugriff darauf gibt.» Die Aussage von Frédéric Kaplan ist radikal. Der Direktor des Labors für Digital Humanities ist besorgt über eine Welt, in der nur digitalisierte Informationen zugänglich sind und alle anderen, auf sonstigen Medien alternde Informationen in Vergessenheit geraten. «Wir müssen dringend eine Brücke zwischen diesen beiden Dingen schlagen. Wir müssen auch mit der Vergangenheit leben.»

Das Projekt Venice Time Machine (VTM) bezweckt nichts anderes als das Schlagen dieser Brücke zwischen Vergangenheit und Gegenwart. Dabei soll auf der Basis von Millionen historischer Dokumente unterschiedlichster Formate ein multidimensionales Modell der Stadt Venedig in Raum und Zeit über die letzten 1000 Jahre erstellt werden. Das Projekt wurde 2012 gestartet und hat nun die Halbzeit erreicht, die mit zwei wichtigen Etappen gefeiert wurde.

«Heute besteht das Ziel darin, einen grossen Simulator zur Kartografierung von 5000 Jahren Geschichte zu bauen.»

Kartografierung von über 5000 Jahren europäischer Geschichte

Die erste Etappe ist die Ausdehnung des Projekts Time Machine auf die europäische Ebene. In einem 2016 verfassten Manifest stellte sich Frédéric Kaplan vor, dass alle Universitäten zusammenarbeiten, um das europäische Kulturgut miteinander zu teilen. Das Dokument stiess auf ein unerwartetes Echo, da Delegierte aus den in der Europäischen Kommission vertretenen Ländern begeistert waren und sich dafür einsetzten. So wurde das Manifest zum ersten konkreten Dokument mit einem Vorschlag für ein FET Flagship des Europäischen Rates. Dieses Programm sichert die Finanzierung einer Forschungsarbeit während zehn Jahren mit einer Milliarde Euro.

Heute besteht das Ziel darin, einen grossen Simulator zur Kartografierung von 5000 Jahren Geschichte zu bauen. Bisher haben 165 Partnerinstitutionen aus 32 Ländern ein Konsortium gegründet, um neue Technologien für die Digitalisierung, die Analyse, den Zugang, die Aufbewahrung und die Kommunikation des kulturellen Erbes im grossen Massstab zu entwickeln. Das Dossier wurde in diesem Monat eingereicht. Das Rennen um eine FET-Flagship-Finanzierung umfasst mehrere Etappen, und das Urteil wird nächstes Jahr gefällt.

Die zweite Etappe betrifft die Aufschaltung von Forschungsschnittstellen, mit denen die über zwei Millionen bereits gescannten Dokumente durchforscht werden können. Der in fünf Jahren – seit dem Beginn der Digitalisierung eigentlich in nur zwei Jahren – zurückgelegte Weg lässt sich anhand folgender Zahlen messen: 190’000 Dokumente aus Staatsarchiven, 720’000 fotografische Dokumente aus der Fondazione Cini und 3000 Bände über die Geschichte der Stadt aus ihren grossen Bibliotheken wurden eingescannt. «Das ist weniger als ein Prozent des Bestandes. Das ist endlos!», sagt Frédéric Kaplan mit noch grösserer Begeisterung. Aber nur so konnte ein Kunstschmuggel zwischen den Niederlanden und Italien aufgedeckt werden!

Bereits mehrere funktionierende Time Machines

Gewisse Städte haben nicht auf Europa gewartet, um ihre eigene Time Machine zu starten. Amsterdam (Foto unten), Nürnberg, Paris, Jerusalem, Budapest und Neapel haben beschlossen, in ihre Archive einzutauchen, um eine riesige, auf nationaler und europäischer Ebene vernetzte Geschichtsdatenbank einzurichten. Weshalb? Julia Noordegraaf, Professorin für digitales Erbe an der Universität Amsterdam, und Sander Münster, Leiter der Abteilung für Medienkonzeption und ‑produktion an der technischen Universität Dresden (Foto nebenan), haben die Frage beantwortet.

 

Zehntausende Anmerkungen

Um zu diesem Ergebnis zu gelangen, mussten zuerst die notwendigen Technologien entwickelt werden, um kilometerweise zum Teil 500 Jahre alte Dokumente schnell zu scannen und zu digitalisieren. Für die Manuskripte und die fragilen grossformatigen Dokumente wurde ein erster halbautomatischer Scanner gebaut und in Betrieb genommen. Ein weiteres Gerät mit Roboterabtastung wendet die Seiten von Zeitungen und Büchern automatisch. Ein drittes, zusammen mit Adam Lowe von Factum Arte entwickeltes kann alle vier Sekunden ein Fotodokument auf beiden Seiten digitalisieren.

Neben der eigentlichen Digitalisierung brachten Historiker, Paleografen und Archivare auf den Dokumentenquellen mehr als 160’000 Anmerkungen bezüglich Namen, Orten und Schlüsselbegriffen an. Dank dieser Anmerkungen auf den Archivdokumenten konnten mithilfe eines automatischen Schrifterkennungssystems die Informationen der Dokumente erfasst werden. «Wir müssen beispielsweise die Vielfalt der Schriften und die zahlreichen, nicht standardisierten Abkürzungen bewältigen», erklärt Sofia Ares Oliveira, Forscherin am Labor für Digital Humanities. «Wir haben dem Computer Beispiele gezeigt, damit er lernt, wie man lernt.» Das System kann ohne Anmerkungen versehene Wörter mit einer Fehlerquote von 4% bei jedem Zeichen transkribieren. «Es ist ein wenig, wie wenn man in einer Suchmaschine einen Tippfehler macht: Es genügt, damit die Suche zutreffende Ergebnisse vorschlägt, und man versteht, worum es geht», erklärt die Forscherin.

Drei Instrumente, um in die Daten einzutauchen

Dank dieser Arbeit werden die Wissenschaftler bis im Sommer eine erste Suchmaschine namens Canvas aufschalten. Sie bietet Zugriff auf die in ihrer Originalversion gescannten Dokumente aus Staatsarchiven, vor allem aber die Möglichkeit einer Stichwortsuche (Person, Ort, Datum etc.) in den Inhalten. Das System funktioniert wie ein Wiki, sodass die autorisierten Benutzer Lesefehler des Systems korrigieren und so dessen Leistung kontinuierlich verbessern können.

Die zweite Digitalisierungsarbeit bezieht sich auf die ikonografische Sammlung der Fondazione Cini. Von einer Million Kunstfotos der Stiftung wurde ein erster Teil mit 730’000 Bildern digitalisiert. Auch hier waren Tausende handschriftliche Anmerkungen notwendig, um den Computer zu trainieren. Als Ergebnis wird die Benutzeroberfläche Replica nicht nur eine textgestützte, sondern vor allem eine visuelle Suche in den Dokumenten anbieten, die Verbindungen zwischen den Bildern herstellt. «Die Maschine hat gelernt, Zusammenhänge zwischen der Zusammenstellung, der Position der Personen sowie den verschiedenen Elementen oder Motiven zu erkennen, um Ähnlichkeiten zwischen Bildern festzustellen. Anschliessend ist es Aufgabe der Historiker, ihre Geschichte zu schreiben», erklärt Benoît Seguin, der diese Suchmaschine im Rahmen seiner Doktorarbeit entwickelte, die er im Sommer verteidigen wird.

Das dritte konkrete Ergebnis der Digitalisierung stellt die wissenschaftlichen Werke und Fachzeitschriften der grossen Bibliotheken der Serenissima mit wenigen Klicks zur Verfügung. Im Rahmen von Linked Books, einem vom SNF unterstützten und von den Forschern Giovanni Colavizza und Matteo Romanello zusammen mit Frederic Kaplan entwickelten Projekt, wurden fast 3000 Werke über Venedig vom 19. bis 21. Jahrhundert sowie über 100 Jahre wissenschaftliche Veröffentlichungen über die Stadt digitalisiert. Dazu wurde eigens ein System entwickelt, um automatisch Zitate aufzuspüren und nachher suchen zu können. Die Venice Scholar getaufte Benutzeroberfläche ermöglicht das Studium der venezianischen Historiografie anhand dieser Zitate. Wie die beiden anderen Systeme ist auch dieses offen, und die Datenbank kann weitere Datensätze aufnehmen. Diese sekundären Quellen sind ebenfalls mit den primären Quellen von Canvas verbunden.

Scrollen
Forschung | 40 artikel