Forschungsprojekt zur automatischen Bearbeitung von Oral-History-Archiven

10. 02. 2022

Gespräch mit Ing. Jan Švec vom Lehrstuhl für Kybernetik an der Westböhmischen Universität Pilsen über die Initiative der automatischen Bearbeitung von Oral-History-Archiven

Sehr geehrter Herr Švec,
können Sie uns bitte Ihre Initiative der automatischen Bearbeitung der Oral-History-Archive vorstellen? Welche Ziele verfolgen Sie mit Ihren Aktivitäten und an welcher Zielgruppe orientieren Sie sich?

Guten Tag,
unsere Bemühungen gehen auf das Projekt NSF MALACH (Multilingual Access to Large Spoken Archives) zurück, an dem wir uns Anfang des Jahrtausends beteiligten. Das Ziel des Projektes war, die Methoden der automatischen Spracherkennung auf Oral-History-Archive anzuwenden, bei diesem konkreten Projekt auf das Archiv USC Shoah Foundation mit Aussagen von Überlebenden des Holocausts-. In dem Projekt konzentrierten wir uns auf die Erkennung des Tschechischen, Slowakischen und Russischen. In den Folgeprojekten, die vor allem durch tschechische Förderer unterstützt wurden, entwickelten wir eine Nutzerschnittstelle für einfache Archivsuche und erweiterten die Palette der unterstützten Sprachen um das Englische. Ein Beispiel der automatisch bearbeiteten Aufnahmen vom YouTube Kanal der USC Shoah Foundation im Englischen findet man unter https://malach.kky.zcu.cz/ .

Wir versuchen unsere Methoden an die Bedürfnisse von Historikern und Forschern anzupassen, die vor allem die Volltextsuche nach konkreten Wörtern oder Wendungen, z.B. Namen oder geographischen Bezeichnungen, nutzen können. Die einfache Benutzerschnittstelle unterstützt die breite Öffentlichkeit beim Stöbern im Archiv und bei eventueller Suche nach Materialien, die beispielsweise mit ihrer Heimatstadt verbunden sind.

Können Sie uns näher erläutern, wie Ihre Plattform für die automatische Bearbeitung und Indexierung von Aufnahmen funktioniert und wo man die von Ihnen entwickelten Technologien überall anwenden kann?

Unsere Plattform bietet eine vollautomatisierte Bearbeitung von Aufnahmen. Bei der Eingabe werden die Aufnahmen mit Metadaten versehen, die bei der Suche und Anzeige in der Benutzerschnittstelle genutzt werden. Diese Aufnahmen werden automatisch in ein einheitliches Format konvertiert, wonach die gewonnene Audiospur mittels Spracherkennung in einen Text übertragen wird, der in der Datenbank indexiert und gleichzeitig zur automatischen Erstellung von Untertiteln genutzt wird. Schließlich werden die Aufnahmen automatisch zur Anzeige und Suche in der Benutzerschnittstellen bereitgestellt.
Im Rahmen der vom tschechischen Kulturministerium geförderten Projekte wurde unsere Plattform noch um die Möglichkeit der Anzeige und der automatischen Bearbeitung von eingescannten typographischen Dokumenten bereichert, wodurch ein Digitales Archiv der Dokumente der NKVD/KGB zur tschechoslowakischen Geschichte entstand (https://archivkgb.zcu.cz/). Gleichzeitig ist es nun möglich, im Rahmen einer Benutzerschnittstelle Aussagen aus den Oral-History-Archiven zusammen mit ergänzenden Materialien wie eingescannten Ermittlungsakten oder Fotografien, zu präsentieren.

Ist es möglich, Ihre Aktivitäten auch in deutschsprachige Länder zu erweitern und Partner aus der Europaregion Donau-Moldau in Ihre künftigen Vorhaben einzubeziehen?

Die automatische Bearbeitung von Aufnahmen erfordert, dass man über Modelle für die automatische Spracherkennung in der jeweiligen Sprache verfügt. Wie ich schon erwähnte, haben wir im Moment Modelle für Tschechisch, Slowakisch und Englisch voll integriert. Deutsch scheint uns eine gute Richtung für unsere künftigen Aktivitäten zu sein. Wir suchen deshalb potenzielle Partner, die an einer automatisierten Bearbeitung von Oral-History-Archiven interessiert sind, sei es in der deutschen Sprache oder auch mehrsprachig.

Kontakt:
Jan Švec
NTIS - New Technologies for Information Society
University of West Bohemia
E-mail: honzas@ntis.zcu.cz
Tel. +420 377 63 2557

Internet:
Katedra kybernetiky, Fakulta aplikovaných věd Západočeské univerzity v Plzni, http://www.kky.zcu.cz/en
Výzkumné centrum NTIS, Fakulta aplikovaných věd Západočeské univerzity v Plzni, https://www.ntis.zcu.cz/en/Research/Speech-and-image-technology/Speech-technology/index.html

Fotoquelle: J. Švec