Wat fir aner Sprooche scho méi laang méiglech ass, dat gëtt et och fir d’Lëtzebuerger Sprooch: eng automatesch Text-Transkriptioun. Iwwer d'Web-App vum Zenter fir dʼLëtzebuerger Spooch (ZLS) an Zesummenaarbecht mam Le Minh Nguyen, Expert an der Voice Technology, ka jiddereen seng geschwate Sätz op eng einfach Aart a Weis verschrëftleche loossen. De Prototyp weist, datt d’Sproocherkennung och op Lëtzebuergesch funktionéiert.

26/09/2023 Schreifmaschinn.lu

De Programm wandelt geschwate Sprooch an en Text ëm. Den Tool gouf mat standardiséierte Radio-Texter trainéiert an ass op dës Textzort spezialiséiert. De Luc Marteling, Direkter vum Zentrum fir Lëtzebuerger Sprooch erkläert:

D'Schreifmaschinn baséiert op engem Sproochemodell, deen am Hannergrond schafft. Dat heescht, wann een en Text draschwätzt, oder en Audiofichier eropluet op de Site, da leeft am Hannergrond den Algorithmus of. Deen interpretéiert dann dat wat en héiert a Wieder an dann entsteet doraus en Text. Dat klappt mëttlerweil iwwerraschend gutt, jee no Qualitéit vun deem Geschwaten oder vun der Audioopnam, kritt een do wierklech ganz korrekt Transkriptioune wat ee gesot huet.   

Dir hutt also hei d’Méiglechkeet, en Text live an e Mikro ze schwätzen oder awer e fäerdegen Audio-Fichier eropzelueden. D’Donnéeë ginn direkt vum Tool ausgewäert, dat kann allerdéngs e puer Sekonnen daueren. De geschwaten Text sollt kloer an däitlech artikuléiert ginn. Wéineg Hannergrondgeräischer féieren zu bessere Resultater.

Den Tool deen elo online ass, ass nach net deen allerbeschten, mir hunn do nach eppes Besseres an der Pipeline, wat deemnächst wäert online goen, wou mer d'Zäit nach kënnen eropsetzen, am Moment ass deen nach limitéiert, well fir déi Transkriptioune vill Rechepower néideg ass. Rechepower verursaacht Käschten. Mee wann awer een elo wéilt eppes Gréisseres transkribéieren, da kann en sech natierlech un eis wenden an da probéiere mer dat hei iwwert eng aner Pipeline ze transkribéieren.     

Schreifmaschinn.lu baséiert um multilingualen Open-Source-Modell XLS-R vu meta.ai. Dee gouf mat 436.000 Stonnen Audiomaterial an 128 verschiddene Sprooche virtrainéiert. Fir dëse Modell spezifesch op d’Lëtzebuerger Sprooch auszeriichten, ass déi kënschtlech Intelligenz hannendru mat lëtzebuergeschen Donnéeën, gréisstendeels mat Radio-Texter gefiddert ginn.