V laboratoriju razvijamo nov koncept razumevanja pogovorne inteligence CLU (conversational language understanding) kot nov edinstven pristop, ki razvija idejo, da so verbalni in neverbalni pogovorni signali komplementarni in enako pomembni v pogovoru. Ključne raziskovalne aktivnosti so usmerjene v razumevanje in modeliranje pogovornega jezika v interakcijah človek-človek. Na področju procesiranja naravnega jezika in razumevanju govorjenega jezika, začenja prevzemati pomembno vlogo v interakciji človek-stroj tako gestikulacija in neverbalna komunikacija, kot tudi sposobnost izražanja informacij ne samo z besedami. Postalo je namreč jasno, da je vključevanje takšnih signalov ključna usmeritev pri ugotavljanju bolj osebnega vidika uporabniških vnosov in načina, kako se odzivi naprav lahko predstavijo ljudem. V neposredni interakciji so neverbalni signali posredovani skupaj z govorjeno vsebino (ali celo v njeni odsotnosti) ključni za vzpostavljanje kohezije v diskurzu. V laboratoriju razvijamo nove modele na osnovi fuzije in tudi algoritme na osnovi umetne inteligence (AI), ki bodo sposobni generirati poglobljeno razumevanje v kognitivnem medsebojnem sovplivanju s komunikativnim namenom kot osrednjim jedrom v človeški interakciji. Algoritmi temeljijo na tehnikah globokega učenja.
Raziskave v laboratoriju se na področju interakcije med človekom in strojem razširjajo na nove mobilne tehnologije in na aplikacije za zaznave širšega konteksta uporabnika na osnovi heterogenih senzorskih sistemov in zlivanja podatkov v konceptu Interneta stvari. Raziskave na tem področju so usmerjene v nove koncepte, metode in pristope heterogenih nosljivih senzorskih sistemov na osnovi pametnih vgrajenih sistemov, ki z nizko energijskimi brezžičnimi komunikacijskimi tehnologijami omogočajo enovito povezovanje z mobilnimi napravami in storitvami v oblaku po konceptu Interneta svari ter podatkovnega zlivanja na osnovi analitike nad veliko količino podatkov. Laboratorij za digitalno procesiranje signalov ima ekspertize na področju procesiranja in generiranja naravnega govora (NLP, NLG, SLU, ECA, TTS, ASR), na področju procesiranja audio-vizualnih signalov in klasifikaciji (klasifikacija spola, emocij, detekcija razpoloženja), uporabniški izkušnji in kvaliteti izkušnje, strojnega učenja in umetne inteligence (vključno globoko učenje), inteligentna IoT okolja in podporna življenjska okolja.