10. 02. 2022
Industrie 4.0 Hochschulen

Gespräch mit Ing. Jan Švec vom Lehrstuhl für Kybernetik an der Westböhmischen Universität Pilsen über die Initiative der automatischen Bearbeitung von Oral-History-Archiven

Sehr geehrter Herr Švec,
können Sie uns bitte Ihre Initiative der automatischen Bearbeitung der Oral-History-Archive vorstellen? Welche Ziele verfolgen Sie mit Ihren Aktivitäten und an welcher Zielgruppe orientieren Sie sich?


Guten Tag,
unsere Bemühungen gehen auf das Projekt NSF MALACH (Multilingual Access to Large Spoken Archives) zurück, an dem wir uns Anfang des Jahrtausends beteiligten. Das Ziel des Projektes war, die Methoden der automatischen Spracherkennung auf Oral-History-Archive anzuwenden, bei diesem konkreten Projekt auf das Archiv USC Shoah Foundation mit Aussagen von Überlebenden des Holocausts-. In dem Projekt konzentrierten wir uns auf die Erkennung des Tschechischen, Slowakischen und Russischen. In den Folgeprojekten, die vor allem durch tschechische Förderer unterstützt wurden, entwickelten wir eine Nutzerschnittstelle für einfache Archivsuche und erweiterten die Palette der unterstützten Sprachen um das Englische. Ein Beispiel der automatisch bearbeiteten Aufnahmen vom YouTube Kanal der USC Shoah Foundation im Englischen findet man unter https://malach.kky.zcu.cz/ .

Wir versuchen unsere Methoden an die Bedürfnisse von Historikern und Forschern anzupassen, die vor allem die Volltextsuche nach konkreten Wörtern oder Wendungen, z.B. Namen oder geographischen Bezeichnungen, nutzen können. Die einfache Benutzerschnittstelle unterstützt die breite Öffentlichkeit beim Stöbern im Archiv und bei eventueller Suche nach Materialien, die beispielsweise mit ihrer Heimatstadt verbunden sind.

 

Können Sie uns näher erläutern, wie Ihre Plattform für die automatische Bearbeitung und Indexierung von Aufnahmen funktioniert und wo man die von Ihnen entwickelten Technologien überall anwenden kann?


Unsere Plattform bietet eine vollautomatisierte Bearbeitung von Aufnahmen. Bei der Eingabe werden die Aufnahmen mit Metadaten versehen, die bei der Suche und Anzeige in der Benutzerschnittstelle genutzt werden. Diese Aufnahmen werden automatisch in ein einheitliches Format konvertiert, wonach die gewonnene Audiospur mittels Spracherkennung in einen Text übertragen wird, der in der Datenbank indexiert und gleichzeitig zur automatischen Erstellung von Untertiteln genutzt wird. Schließlich werden die Aufnahmen automatisch zur Anzeige und Suche in der Benutzerschnittstellen bereitgestellt.
Im Rahmen der vom tschechischen Kulturministerium geförderten Projekte wurde unsere Plattform noch um die Möglichkeit der Anzeige und der automatischen Bearbeitung von eingescannten typographischen Dokumenten bereichert, wodurch ein Digitales Archiv der Dokumente der NKVD/KGB zur tschechoslowakischen Geschichte entstand (https://archivkgb.zcu.cz/). Gleichzeitig ist es nun möglich, im Rahmen einer Benutzerschnittstelle Aussagen aus den Oral-History-Archiven zusammen mit ergänzenden Materialien wie eingescannten Ermittlungsakten oder Fotografien, zu präsentieren.


Ist es möglich, Ihre Aktivitäten auch in deutschsprachige Länder zu erweitern und Partner aus der Europaregion Donau-Moldau in Ihre künftigen Vorhaben einzubeziehen?


Die automatische Bearbeitung von Aufnahmen erfordert, dass man über Modelle für die automatische Spracherkennung in der jeweiligen Sprache verfügt. Wie ich schon erwähnte, haben wir im Moment Modelle für Tschechisch, Slowakisch und Englisch voll integriert. Deutsch scheint uns eine gute Richtung für unsere künftigen Aktivitäten zu sein. Wir suchen deshalb potenzielle Partner, die an einer automatisierten Bearbeitung von Oral-History-Archiven interessiert sind, sei es in der deutschen Sprache oder auch mehrsprachig.

 

Kontakt:
Jan Švec
NTIS - New Technologies for Information Society
University of West Bohemia
E-mail: honzas@ntis.zcu.cz
Tel. +420 377 63 2557

Internet:
Katedra kybernetiky, Fakulta aplikovaných věd Západočeské univerzity v Plzni, http://www.kky.zcu.cz/en
Výzkumné centrum NTIS, Fakulta aplikovaných věd Západočeské univerzity v Plzni, https://www.ntis.zcu.cz/en/Research/Speech-and-image-technology/Speech-technology/index.html

Fotoquelle: J. Švec


Zurück
Mapa
Sommerjob in der EDM

Sommerjob in der EDM

Sammeln Sie Erfahrungen

Archiv
Ikona

Entdecke die Europaregion

28 barocke Kulturschätze

28 barocke Kulturschätze

28 barocke Kulturschätze

Heimatschätze

Heimatschätze

Tradition, die man nicht ins Museum stellen kann

Videovorstellung einiger Hochschulen

Videovorstellung einiger Hochschulen

Studierende zeigen was angesagt ist- Hochschuleinrichtungen in der Dreiländerregion jetzt auch in Bild und Ton

Podcast-Reihe "Gesund leben in der EDM"

Podcast-Reihe "Gesund leben in der EDM"

Hochschulführer

Hochschulführer

Ein Hochschulleitfaden für die Europaregion

Best Practice Projekte

Best Practice Projekte

Aus dem Hochschulbereich

Sommerjobs in der EDM

Sommerjobs in der EDM

Sammeln Sie Erfahrungen

Fotodatenbank der EDM

Fotodatenbank der EDM

Fotografien für die breite Nutzung

Tipps zu Museen und Galerien

Tipps zu Museen und Galerien

Vielfältiges Angebot

28 Burgen und Schlösser

28 Burgen und Schlösser

Entdecken Sie außergewöhnliche Sehenswürdigkeit

28 schönste Rundwanderungen

28 schönste Rundwanderungen

Wanderausflüge durch die Europagerion

28 schönste Tagestouren

28 schönste Tagestouren

Mit dem Fahrrad durch die EDM

28 traditionelle Rezepte

28 traditionelle Rezepte

Kochen mit der Europaregion

Wir kochen gut

Wir kochen gut

Geschmack der Europaregion

Zweisprachigkeit in der EDM

Zweisprachigkeit in der EDM

Unser Angebot

Glossar

Glossar

Glossar

Moderne Gemeinde

Moderne Gemeinde

Im Gespräch über Digitalisierung

Datenbank der Gemeinden

Datenbank der Gemeinden

Übersicht aller Gemeinden in der EDM

Inspiration zu einer modernen Gemeinde

Inspiration zu einer modernen Gemeinde

Beispiele für Digitalisierung