rozhovor s inženýrem Janem Švecem z katedry kybernetiky Západočeské Univerzity v Plzni k iniciativě automatického zpracování archivů orální historie a hledání nového projektového partnera v rámci ERDV
Vážený pane inženýre,
můžete nám prosím představit Vaši iniciativu automatického zpracování archivů orální historie? Jaké cíle si v rámci Vašich aktivit kladete a na jakou cílovou skupinu se zaměřujete?
Dobrý den,
naše snaha má své kořeny v projektu NSF MALACH (Multilingual Access to Large Spoken Archives), jehož jsme se počátkem tisíciletí účastnili. Cílem projektu bylo aplikovat metody automatického rozpoznávání řeči na archivy orální historie, v tomto konkrétním projektu na archiv USC Shoah Foundation obsahující výpovědí lidí, kteří přežili Holocaust. V tomto projektu jsme se zaměřili na rozpoznávání češtiny, slovenštiny a ruštiny. V následujících projektech podpořených především českými poskytovali jsme vytvořili především uživatelské rozhraní pro snadné vyhledávání v archivech, stejně jako jsme dále rozšířili paletu podporovaných jazyků především o angličtinu. Ukázka automaticky zpracovaných nahrávek z YouTube kanálu USC Shoah Foundation v angličtině je dostupná na adrese https://malach.kky.zcu.cz/ .
Naše metody se snažíme přizpůsobit komunitě historiků a badatelů, kteří mohou používat především fulltextové vyhledávání konkrétních slov a frází, například jmen nebo geografických názvů. Zároveň jednoduché uživatelské rozhraní podporuje širokou laickou veřejnost v procházení archivní materiálů a případném vyhledávání materiálů souvisejících například s jejich rodným městem.
Můžete nám blíže přiblížit, jak Vaše platforma pro automatické zpracování a indexaci nahrávek funguje a kde všude je možné Vámi vyvinuté technologie využít.
Naše platforma nabízí plně automatizované zpracování nahrávek. Na vstupu máme nahrávky opatřené metadaty, která jsou použita při vyhledevání a zobrazení v uživatelském rozhraní. Tyto nahrávky jsou automaticky zkonvertovány do jednotného formátu, je z nich získána audiostopa, ta je následně rozpoznána do textu. Rozpoznaný text je zaindexován v databázi a zároveň je použit pro automatické vygenerování titulků. Nakonec jsou nahrávky automaticky zařazeny ke zobrazení a vyhledávání v uživatelském rozhraní.
V rámci projektů podpořených českým Ministerstvem kultury jsme zároveň obohatili naší platformu o možnost zobrazení a automatického zpracování skenovaných strojopisných dokumentů, vznikl tak Digitální archiv dokumentů NKVD/KGB k československé historii (https://archivkgb.zcu.cz/). Zároveň dokážeme v rámci jednoho uživatelského rozhraní prezentovat výpovědi z archivů orální historie spolu s doplňujícími materiály, např. skeny vyšetřovacích spisů nebo fotografiemi.
Je možné rozšířit Vaše aktivity také do německy mluvících zemí a zahrnout také partnery z Evropského regionu Dunaj-Vltava do Vašich budoucích záměrů?
Automatické zpracování nahrávek vyžaduje mít dostupné modely pro automatické rozpoznávání řeči v daném jazyce. Jak jsem již zmiňoval, v současnosti máme plně integrovány modely pro češtinu, slovenštinu a angličtinu. Němčina se nám jeví jako směr, kam bychom mohli cílit s našimi aktivitami. Hledáme proto i možné partnery, kteří by měli zájem o automatizované zpracovávání archivů orální historie, ať již v německém jazyce nebo i vícejazyčné.
Kontakt:
Jan Švec
NTIS - New Technologies for Information Society
University of West Bohemia
E-mail: honzas@ntis.zcu.cz
Tel. +420 377 63 2557
Internet:
Katedra kybernetiky, Fakulta aplikovaných věd Západočeské univerzity v Plzni, http://www.kky.zcu.cz/en
Výzkumné centrum NTIS, Fakulta aplikovaných věd Západočeské univerzity v Plzni, https://www.ntis.zcu.cz/en/Research/Speech-and-image-technology/Speech-technology/index.html
Foto: Ukázka interaktivního vyhledávání prostřednictvím uživatelského rozhraní. (zdroj J. Švec)