Co je MALACH?
MALACH (z anglického Multilingual Access to Large Audio arCHives - mnohojazyčný přístup do velkých audioarchívů), což ovšem současně hebrejsky znamená "anděl".
Co obsahuje?
V devadesátých letech tedy týmy tazatelů navštěvovaly ve světě žijící pamětníky a nahrávaly jejich vzpomínky na analogový videozáznam, který byl později digitalizován. Dnes tento archiv, který velikostí osmi petabajtů (tisíců bilionů bajtů) patří mezi největší digitální knihovny na světě, spravuje Jihokalifornská univerzita v Los Angeles.
Co může ovlivnit?
Nemám teď na mysli jen práci historiků, sociologů nebo filmařů. Významným "pokusným objektem" je MALACH i pro lingvisty, matematiky, ale i IT specialisty a vývojáře SW programů. Protože:
Téměř 52 tisíce videozáznamů vyprávění pamětníků má dohromady přes 105 tisíc hodin. Kdyby je chtěl jeden badatel všechny zhlédnout a věnoval prohlížení deset hodin denně a pět dnů v týdnu, trvalo by mu to čtyřicet let. A to by ještě musel umět dvaatřicet jazyků, v nichž jsou výpovědi namluveny.
Což je obrovská výzva pro oblast počítačového rozpoznávání řeči. Tady na Inflow jistě nemusím zdůrazňovat, k čemu všemu by to bylo dobré, že? ;)
Na závěr pár odkazů:
- zdrojový článek na Aktuálně.cz
- články v časopisu UK IForum o testovacím provozu přístupu do MALACHu a o zapojení českých vědců do projektu
- domovská stránka projektu











počítačové rozpoznávání mluveného jazyka
Na tomto se v ČR již nějakou dobu pracuje např. na katedře kybernetiky ZČU