Die im Trinity
College Dublin aufbewahrten "1641 Depositions" sind nur ein Beispiel der
vielen bedeutenden Sammlungen des kulturellen und historischen Erbes,
das in Universitäten, Museen, Archiven und privaten Sammlungen in ganz
Europa lagert. Ein Aufstand irischer Katholiken im Jahr 1641 änderte den
Verlauf der irischen Geschichte und führte außerdem zur Schaffung einer
der umfangreichsten historischen und kulturellen Aufzeichnungen
Europas: die 1641 Depositions umfassen nahezu 20.000 Seiten mit 8000
Aussagen von Zeitzeugen. Jahrzehnte und in vielen Fällen sogar
Jahrhunderte lang haben Forscher, Studenten und Mitglieder der
allgemeinen Öffentlichkeit diese Sammlungen nach Details über die
Vergangenheit untersucht – ein arbeits- und zeitaufwändiges Verfahren
mit vielen Fallstricken und Sackgassen. Unvollständige und
widersprüchliche Texte, fehlende Wörter, Druck- und Schreibfehler,
Veränderungen der Sprache im Laufe der Zeit und der bloße Umfang des
Materials sind nur einige der Herausforderungen, die bewältigt werden
müssen.
Eine von einem Team mit Forschern aus Österreich, Bulgarien, Irland,
Israel und Italien entwickelte Lösung greift auf modernste IKT zurück,
die den größten Teil der schwierigen Arbeit erledigt. Mit
Forschungsfördermitteln der Europäischen Kommission in Höhe von 2,8 Mio.
EUR trägt die Arbeit des Projekts "Cultivating understanding and
research through adaptivity" (CULTURA) dazu bei, digitalisierte Archive
zu deuten, Widersprüche in der Sprache auszuräumen, Verbindungen
zwischen historischen Ereignissen, Personen und Gegenständen
herzustellen und das reiche kulturelle und historische Erbe Europas
allen zugänglich zu machen.
"Wenn man historisches Material betrachtet sind viele Informationen
nicht gleich offensichtlich. Es kann viele Zweideutigkeiten und
Widersprüche geben. Daher brauchen wir Verfahren, mit denen wir diese
Informationen aufdecken können und die nicht offensichtlichen Referenzen
finden", erklärt Dr. Owen Conlan, Lehrbeauftragter der Knowledge and
Data Engineering Group an der School of Computer Science and Statistics
am Trinity College. "Wir können anhand dieser Informationen dann die
Grundlagen legen und Verbindungen zwischen den Referenzen ziehen, die
eventuell zuvor nicht offensichtlich waren."
Dr. Conlan, der das CULTURA-Projekt koordiniert, weist auf das
Beispiel der "1641 Depositions" hin. Unter den vielen Personen, die in
den Zeugenaussagen genannt werden, wird mehrmals Phelim O'Neil, ein
irischer katholischer Adliger und Anführer der Rebellen im Aufstand,
erwähnt. Aber in den Texten und anderswo wird er auch Sir Felim O'Neill
of Kinard, PhelimMacShane O'Neill oder Féilim Ó Néill bzw. einfach der
Rebell genannt, wie in folgendem Beispiel ersichtlich:
"And he saith, that during the time he, this deponent, was so
restrained and stayed amongst the rebels, he observed and well knew that
the greatest part of the rebels in the county of Armagh went to besiege
the Castle of Augher, where they were repulsed, and divers of the rebel
O'Neils slain; in revenge whereof, the grand rebel, Sir Phelim O'Neil,
knt., gave direction and warrant to one Maolmurry McDonnell, a most
cruel and merciless rebel, to kill all the English and Scottish men..."
Historische soziale Vernetzung
Um den Sinn solcher "verrauschten" historischen Texte zu
interpretieren und anzufangen, die Referenzen in Verbindung zu setzen,
nutzte das CULTURA-Team modernste Software zur natürlichen
Sprachverarbeitung ein, um die Sprache zu normalisieren und ihr eine
semantische Bedeutung zu verleihen, die sowohl von Computern als auch
von Menschen verstanden wird.
"Wir verändern das Dokument nicht und haben sichergestellt, dass wir
dem Original treu bleiben. Jedoch baut unser System eine andere
Informationsebene auf, von der die Bedeutung erschlossen werden kann",
sagt Dr. Conlan.
Mit leistungsstarken Algorithmen werden Einheiten und ihre
Beziehungen aus dem Inhalt extrahiert, um die wichtigen Personen,
Ereignisse, Daten und andere Einheiten und Beziehungen hervorzuheben.
Hierauf aufbauend analysieren die vom Team entwickelten Tools die
Verbindungen zwischen den Einheiten und Beziehungen innerhalb des
Inhalts - wodurch eine Art historisches soziales Netzwerk aufgebaut
wird, das die Platzierung historischer Ereignisse und Figuren im Kontext
unterstützt und die bildliche Darstellung und das Verständnis
erleichtert.
Der Ansatz lässt sich nicht nur auf Texte, wie die "1641
Depositions" anwenden, sondern auch auf Bilder. In diesem Fall werden
Metadaten während der Digitalisierung mit Bildern verknüpft und mit
Kommentaren versehen, um eine semantische Bedeutung zu liefern. Mit
diesem Prozess analysiert das CULTURA-Team die Kollektion des Imaginum
Patavinae Scientiae Archivum (IPSA), das sich an der Universität Padua
in Italien befindet. Hierbei handelt es sich um ein digitales Archiv
bestehend aus Manuskripten und Illustration mit lateinischen
Kommentaren, die im 14. Jahrhundert von Kräuterkundigen angefertigt
wurden.
"Die IPSA-Sammlung basiert hauptsächlich auf Bildern, wobei
sachliche Metadaten verfügbar sind. Diese Metadaten liefern nicht nur
beschreibende Passagen, sondern sind auch historisch wertvoll, da sie
die Prozesse erfassen, die während des Aufbaus der ursprünglichen
Sammlung vorherrschten", bemerkt Dr. Conlan. "Mit unserer sozialen
Netzwerkanalyse können wir beispielsweise erkennen, wer die
Illustrationen gezeichnet und wer sie finanziert hat sowie von welchen
anderen Illustrationen sie beeinflusst wurden."
Bezeichnenderweise bietet das CULTURA-System nicht nur einfach
inhaltsorientierte Anpassungsfähigkeit je nach den zu untersuchenden
Materialien, sondern kann sich auch an die Bedürfnisse einzelner Nutzer
und Nutzergemeinschaften anpassen. Ein Forscher an einer Hochschule, der
auf einem bestimmten Gebiet oder einer Materialsammlung über
umfangreiches Fachwissen verfügt, kann mit dem System nach einer ganz
speziellen Referenz suchen. Andererseits kann eine Privatperson, die
sich für einen bestimmten Abschnitt in der Geschichte interessiert, nach
einer allgemeineren Sichtweise suchen.
"Beispielsweise haben wir bemerkt, dass Jungforscher, die das System
verwendet haben, bei ihren Forschungsarbeiten tiefgründiger arbeiten
und schneller vorankommen", bemerkt Dr. Conlan.
Mehr Zugänglichkeit zum kulturellen und historischen Erbe
Die CULTURA-Plattform kann die Anforderungen dieser und vieler
anderer Benutzertypen durch einen innovativen individuellen
Anpassungsprozess erfüllen, der Benutzerprofile und den Kontext
berücksichtigt, in dem sie Informationen suchen oder darauf zugreifen.
In die Plattform integrierte "Widgets" geben Empfehlungen zum
verknüpften Kontext, der von Interesse sein könnte, indem sie sich
darauf stützen, was für ähnliche Benutzer interessant war. Das System
bietet neue Suchwege, überlässt aber die letztendliche Entscheidung dem
Nutzer.
"Eine gute Personalisierung ist wie ein guter Geschichtenerzähler.
Ein guter Geschichtenerzähler weckt das Interesse seiner Zuhörer, wägt
ihre Reaktionen ab und passt die Geschichte daran an. Bei der
Personalisierung geht es aber um einen Geschichtenerzähler nur für eine
Person", sagt Dr. Conlan.
Das System kann sogar dynamische Handlungsstränge zu bestimmten
Ereignissen, Daten, Orten oder Personen liefern, sodass jeder Nutzer der
Erzählung einfach folgen kann, die sich dynamisch an das Profil und die
Verwendungshistorie des Benutzers anpasst.
"Historische Ressourcen sollten nicht nur Universitätsprofessionen
und -forschern zur Verfügung stehen, sondern auch vielen anderen
Personengruppen, angefangen bei Schülern und Studenten bis hin zu
historischen Gesellschaften und Interessengruppen sowie Privatpersonen",
unterstreicht", Dr. Conlan. "Eine der größten Herausforderungen
digitaler Sammlungen ist die Zugänglichkeit und die Sensibilisierung -
CULTURA macht große Fortschritte bei der Bewältigung dieser Probleme."
Neben den "1641 Depositions" und der IPSA-Sammlung begann das Team
auch damit, die CULTURA-Plattform für eine Sammlung historischer
Materialien im Zusammenhang mit einem anderen Wendepunkt in der irischen
Geschichte, als irische Republikaner gegen die britische Herrschaft
aufbegehrten, nämlich dem Osteraufstand von 1916 und dessen Folgen zu
nutzen.
"Die Hundertjahrfeier dieser Ereignisse steht vor der Tür, daher ist
es für Irland eine wichtige Zeit. Wir planen eine umfassende
Zusammenarbeit mit Schulen, insbesondere da dieses Material
zeitgenössischer und zugänglicher ist", sagt der Koordinator von
CULTURA. "Vor allem wollen wir Geschichten mit Menschen verknüpfen, die
tatsächlich gelebt haben und in den Dokumenten erwähnt werden, da es
sich hierbei um Einheiten handelt, die den größten Respekt verdienen.
Auf diese Weise interessieren wir die Nutzer für andernfalls abstrakte
Ereignisse und platzieren sie in einem klareren Kontextrahmen."
Einige der Partner wollen die Plattform auch nach dem Projektende
unterstützen, um ihre Anwendung auf andere Sammlungen auszuweiten,
während einzelne Partner bestrebt sind, verschiedene Teile der
Technologie des Systems zu kommerzialisieren.
CULTURA erhielt Forschungsmittel innerhalb des Siebten Rahmenprogramms der Europäischen Union (RP7).
Link zum Projekt auf CORDIS:
- RP7 auf CORDIS
- Datenblatt des Projekts CULTURA auf CORDIS
Link zur Projektwebsite:
- Website von "Cultivating understanding and research through adaptivity"
Weitere Links:
- Website er Europäischen Kommission zur Digitalen Agenda