Razvoj sistema za pretvorbo besedil v govor z globokimi nevronskimi mrežami
Avtor: Matevž Bratina
Mentor: izr. prof. dr. Matej Rojc univ. dipl. inž. el.
Stopnja: 2.
Datum: september, 2021
DKUM: MATEVŽ BRATINA
Avtor: Matevž Bratina
Mentor: izr. prof. dr. Matej Rojc univ. dipl. inž. el.
Stopnja: 2.
Datum: september, 2021
DKUM: MATEVŽ BRATINA
Povzetek
V magistrski nalogi smo razvili sistem pretvorbe besedila v govor PLATTOS za več jezikov. Sistem bazira na osnovi globokih nevronskih mrež. Osnovni cilj naloge je bil razviti in testirati sistem sinteze govora na osnovi globokega učenja, ki bo čim bolje generiral govor v več jezikih, pri čemer je tudi pomemben čas generiranja. Prvi del naloge tako predstavlja pregled tehnologij sistemov sinteze govora in njihova podrobnejša analiza. Zanimala nas je namreč arhitektura sistema sinteze govora, medsebojna primerjava zmogljivosti sistemov, njihov razvoj in kvaliteta sintetiziranega signala, ki ga določen TTS lahko generira. Sledila je izbira tehnologije globokega učenja, in razvoj novega TTS sistema. Izbrali smo tisto, ki je izkazovala največji potencial, da izpolni vse zastavljene cilje. Sledil je razvoj TTS sistema. Za prvo stopnjo (pretvorba vhodnega besedila v spektrogram) smo izbrali Tacotron globoki model. Ta je namenjen pretvorbi spektrogramov v pripadajoči govorni signal. V drugi stopnji, smo izbrali vokoder Waveglow. Pred izbiro komponent sistema, smo različne tipe vokoderjev in rekonstrukcijskih algoritmov tudi testirali. Sistem TTS na osnovi globokih nevronskih mrež PLATTOS smo testirali na različnih prosto dostopnih bazah govornih podatkov večih jezikov. Ocenjevali in primerjali smo tudi kvaliteto sinteze govora različnih arhitektur z globokimi nevronskimi mrežami. Kot kriterij kvalitete sinteze govora, smo bili predvsem pozorni na naravnost in razumljivost sintetiziranega govora. Pri ocenjevanju kvalitete smo tako uporabili subjektivne MUSHRA teste.
Sinteza govora …
Globoko učenje in arhitekture nevronskih mrež v sistemih za sintezo govora
Eksperimentalno okolje
Rezultati