Trajanje: 09/09/2019 – 08/09/2023
Tip projekta: COST projekt
Vodja: Isabelle Augenstein, Denmark
MC na UM FERI: izr. prof. dr. Matej Rojc
Povezava: COST CA18231
Generiranje jezika (LG) je ključna tehnologija, če naj stroji brez težav komunicirajo z ljudmi z uporabo naravnega jezika. Veliko število različnih nalog na področju procesiranja naravnega jezika (NLP) predstavljajo naloge generiranja jezika, in da lahko učinkovito izvajajo takšne naloge, pomeni (1), da imajo stroji globalno znanje, ki lahko zahteva večmodalno procesiranje in sklepanje (npr. besedilno oz. vizualni in auditorni vhodi, ali senzorski podatkovni tokovi), in (2) študija zmogljivih, novih metod strojnega učenja (ML) (npr. strukturirano napovedovanje, generativni modeli), saj se skoraj vsi najsodobnejši modeli NLP učijo iz podatkov. Poleg tega se jeziki lahko zelo razlikujejo tako ortografsko (t.i. skripte) kot tudi po svoji notranji strukturi (tj. slovnici), kar nakazuje, da je večjezičnost osrednji cilj, če naj stroji izvajajo brezhibno generiranje jezika. Tehnologije generiranja jezika bodo zelo koristile tako javnim kot privatnim storitvam, ki se ponujajo državljanom EU v večjezični Evropi, in bodo imele močan gospodarski in družbeni učinek.
Generiranje naravnega jezika (NLG) zajema vse naloge procesiranja naravnega jezika (natural language processing NLP), ki se ukvarjajo s samodejnim (ali pol-avtomatskim) generiranjem berljivega besedila. Besedila, ki jih ustvarijo NLG modeli imajo običajno veliko audienco in so lahko precej aplikacijsko specifični. Te aplikacije lahko razvrstimo na dve široki področji: generiranje tekst-v-tekst in generiranje podatki-v-tekst. Prva zajema obstoječa besedila kot vhod in generira koherentni tekst kot izhod. Primer aplikacij vključuje odgovarjanje na vprašanja (QA), pretvarjanje nejezikovnih podatkov v besedilo – na primer nogometne komentarje, ustvarjanje vremenskih in finančnih poročil, povzetek informacij pacienta in ustvarjanje slik/video posnetkov.
Dialog, interakcija in aplikacije za generiranje pogovornega jezika
HCI skozi pogovor v naravnem jeziku je trenutno eno najbolj dejavnih raziskovalnih področij, kjer se nove komercialne aplikacije pojavljajo praktično vsak dan. Tako imenovana paradigma umetne inteligence (v večini primerov globoko učenje) se pogosto uporablja pri reševanju problemov na osnovi dialoga. Čeprav so trenutno dosežki obetavni in so številna svetovna podjetja in univerze osredotočile svoja prizadevanja na področju HCI, izzivi resnično inteligentnega razumevanja naravnega jezika (NLU) in ustreznega NLG glede ustreznosti odzivov in naravnosti ustvarjenih izhodov še niso obravnavani. CA18231 bo presegla najsodobnejšo tehnologijo na tem področju z uporabo LG modelov pri interakciji HCI naloge za mnogo zanimivih in zahtevnih primerov uporabe v realnem svetu, kot so npr. pogovorni vmesniki za iskanje; popolnoma opredeljeni modeli dialoga; modeli dialoga v realnem času; in pogovorni roboti. Zaradi kompleksnosti NLU in NLG, se veliko raziskav osredotoča na razvoj sistemov od konca do konca. Vendar so ti močno odvisni od razpoložljivosti ustreznih podatkov za učenje. Pomanjkanje potrebnega nabora podatkov (zlasti večmodalnih) omejuje raziskave na področju globokega učenja za HCI. CA18231 bo to težavo reševala z izgradnjo večjezičnih večmodalnih naborov podatkov za vrednotenje večmodalnih vmesnikov. Sedanje metode še niso rešile težave, da bi imeli resnično naravni pogovor. Eno glavnih vprašanj je težava pri vrednotenju NLG sistemov, saj so lastne metrike vrednotenja (npr. BLEU, ROUGE) pogosto slaba rešitev za uspešnost modela (Belz, 2009). CA18231 se bo najprej lotil tega vprašanja s poudarkom na potrebi po zunanjem vrednotenju. Konkretno, agenti dialoga se bodo testirali v nadzorovanih okoljih s strani industrijskih partnerjev.
(Vir: Memorandum of Understanding za COST CA18231)
Aktivnosti programa
Zaključna poročila
PDF dokument.pdf
Sodelujoči v projektu
Periodični sestanek COST akcije CA18231
Prvi MC sestanek – COST “Kick off” meeting