Zesumme mam Zenter fir d'Lëtzebuerger Sprooch huet de Student Le Minh Nguyen en Tool erfonnt, fir och Lëtzebuergesch z'erkennen.

De Le Minh Nguyen huet wärend der Pandemie, wéi esou muncher Lëtzebuerger, déi eng oder aner Pressekonferenz gesinn. Mat engem inklusive Gedanken, ass him d'Iddi komm, dass et wuel praktesch wier, wann zum Beispill Leit, déi net gutt héieren, an engems mat liese kéinten. Wuel goufen eng Rei Saache simultan a Gebäerdesprooch iwwersat, mee wéi all Sproch muss een déi fir d'éischt mol léieren, éier ee matschwätze kann. Fir de Le Minh war dat en Challenge, deen och nach perfekt zu sengem Studium Voice Technology gepasst huet. Ma fir dem Computer eng geschwate Sproch bäizebréngen, brauch et virun allem vill Donnée.

"Firwat et schwéier ass, d'Spuer kënne fir Lëtzebuerg ze erméiglechen, ass, well et eis un Donnéeë feelt, déi net transkribéiert sinn. Mir hu vill Donnéeën um RTL oder um Public, déi net beschrëft sinn a fir esou Technologien ze erreechen, brauche mir och déi Donnéeën, déi beschrëft sinn an domadder och kënnen trainéieren", erkläert de Le Min.

Well de Computer muss de Lien maachen tëschent dem geschwate Wuert an dem geschriwwenen. Dohier ass et wichteg, dass een eng grouss Librairie huet, wou Toun an Text verbonne sinn. Esou eng Librairie huet de Le Min am Zenter fir d’Lëtzebuerger Sprooch fonnt.

"Mir hunn eisen Datesaz geholl vun Audioen, vu lëtzebuergeschen Audioen an hunn dee synchroniséiert mat dem Text. Mir hunn e souzesoen hypersynchroniséiert op eng Zéngtel Sekonn hin, datt dee genau ugepasst ass, datt déi iwwerenee leien an orthografesch korrekt sinn", sou den Sven Collette, Computerlinguist vum ZLS.

Am ZLS si se scho méi laang derhannert, fir d'Lëtzebuerger Sprooch an déi richteg Eenten an Nullen ëmzewandelen. Dofir brauch ee kënschtlech Intelligenz a Computing Power. Dat hu se éischter am Silicon Valley wéi zu Stroossen, esou ass et och e Modell vun enger vun de Gafa-Firmen, deen als Basis gedéngt huet.

"De Basismodell, mat deem mer hei schaffen ass e Modell vu Facebook vu Meta, deen et och nach kee Joer gëtt, dat heescht, dee Beräich geet immens séier virun an obwuel et dofir dann Ustrengunge gi sinn, ware mer einfach net op deem Niveau, fir am Lëtzebuergesche kënne matzespillen", erkläert de Sven Collette weider.

Esou ass d’Verständnis fir d’Lëtzebuergescht als éischt iwwer d’Englesch gaangen, well et do méi Date ginn.

"Englesch ass eng high resource language an do si vill Donnéeën, déi do ginn et vill Donnéeën an dofir hu mir de Modell fir d'éischt op Englesch trainéiert an dann op Lëtzebuerg gefiddert, dat ass dat, wat hei geschitt ass a mir huelen e Modell vun enger grousser Firma, verfeineren dee mat proppere lëtzebuergeschen Donnéeën an da kënnen, mir deen och op Lëtzebuerger Sprooch uwennen", sou de Le Minh Ngyuen.

Et schwätzt een esou, wéi engem de Mond gewuess ass, dat ass an der Digitaler Welt net anescht. Eng KI baséiert sech ëmmer op dat Wëssen, mat deem se gefiddert ginn ass, an dat ass am dësem Fall vill RTL.

"Mir hu vun Ufank un eng aachthonnert Stonnen Audiomaterial geliwwert. Dee gouf dann eebe benotzt, fir déi Intelligenz do opzebauen an natierlech ass Audio net duergaangen. De ganzen Audio gouf natierlech och mat Text beräichert. Dat heescht identesch zum Audio gouf et och eng Text-Versioun, déi huet dann den Outil lues a lues geléiert, ech mengen do sinn eng 17 Stonnen verifizéiert", verzielt de Steve Schmit Deputy CEO beim RTL.

Als Verglach... bis dass Siri, Alexa, a Co esou gutt Englesch verstinn, wéi se dat haut maachen, huet et 80 Stonnen un Date gebraucht, an dat aus alle Liewenssituatiounen.

Esou versteet den Tool am Moment ganz gutt RTL, mee bei den Discoursen an den Deputéierten deet e sech schwéier, dat wéinst Fachwierder an enger anerer Touncoulisse an der Chamber. Theoretesch dierft een da jo net fluche kënnen, well mir fluche jo hei net op Antenn. E kann awer fluchen, ënnert anerem "Nondikass, wat ass dat do eppes'".

Op Schreifmaschinn.lu kann een den Tool testen, einfach een Audio vun 30 Sekonne maximal eroplueden oder aschwätzen, a bannent Sekonne kritt een den Text ugewisen. Allerdéngs notzt et elo näischt den Tool Schëmmel a Bless ze vernennen, an der Hoffnung, dass en esou fluche léiert, well de Moment näischt vun deene Saachen an d’Librairie vun der Schreifmaschinn mat afléisst.

Fir eng Stonn Gespréich op der Hand ze transkribéieren, brauch ee bal ee ganze Schaffdag. Déi automatesch Schreifmaschinn mécht dat quasi an Echtzäit, esou séier tippt och déi beschten Dactylo net, a wann da just mat Pausen. De Computer awer gëtt net midd, an esou kann ee quasi alles, wat geschwat ginn ass, och an Text iwwersetzen.

"Zum Beispill wann een am Bus sëtzt, an do kuckt een e Journal vun der Tëlee, et wëll een awer net den Noper niewendrun oder d'Leit soss am Bus stéieren, entweeder deet ee Kopfhörer un oder mat deem neien Tool kann een iergendwann elo eng Kéier - net elo vu muer - eng Kéier dann de Journal kucken a mat den Ënnertitelen, vun deem, wat an deem Journal gesot gëtt. Dat heescht, et kann een am Fong de Journal kucken a liesen", sou de Steve Schmit.

Domat wier dann dem Le Minh säin Zil vu méi Integratioun gepackt. Awer och bei Gemengerotssëtzungen, en Verbatim um Geriicht, Chatbotten an de Callcenteren, an nach villes méi kann ee mat der Sproocherkennung op Lëtzebuergesch méi einfach een Text generéieren, deen een dann duerchsichen an och weider verschaffe kann.

De Gros vun deene Modeller vun de gréisste Firmen ass als Open source, dat heescht, do kann all Entwéckler, deen erofluede goen an domadder schaffen, an dat ass genau dat, wat mir och wëlle maachen. Dat heescht eise Modell hei, dee mir hu vu Sprooch-Erkennung, wat mer och an den nächste Wochen opmaachen, datt jiddweree se kann eroflueden a selwer verbesseren oder aner Appen domadder bastelen.

Do ass der Kreativitéit keng Grenz gesat. Bis dass dat Ganzt da Feelerfräi mat Punkt a Komma funktionéiert, sinn nach e puer Algorithmen an och Daten néideg. Dat leschte Wuert ass bäi deem Sujet nach net geschwat.