Kazalo:
Opredelitev - Kaj pomeni sinteza govora?
Sinteza govora je umetna simulacija človeškega govora z računalnikom ali drugo napravo. V nasprotju s prepoznavanjem glasu, sintezo govora se večinoma uporablja za prevajanje besedilnih informacij v zvočne informacije in v aplikacijah, kot so storitve z glasom in mobilne aplikacije. Poleg tega se uporablja tudi v pomožni tehnologiji za pomoč posameznikom z motnjami vida pri branju besedilne vsebine.
Tehopedija razlaga sintezo govora
VODER Homerja Dudleyja, ki je temeljil na vokoderju podjetja Bell Laboratories, velja za prvi popolnoma funkcionalen sintetizator glasu. Računalnik, ki se uporablja pri sintezi govora, je znan kot sintetizator govora ali računalnik govora. Kakovost govornega računalnika pogosto sodimo po njegovi podobnosti s človeškim glasom. Večina računalniških operacijskih sistemov ima vgrajene sintetizatorje govora od zgodnjih devetdesetih let. Sintetizirani govor običajno nastaja s pomočjo povezovanja kosov posnetega govora, ki je vsebovan v bazi podatkov.
Začetna faza sinteze govora je predobdelava, ki odpravlja dvoumnost okoli načina, kako je treba prebrati določeno besedo in ki vključuje tudi ravnanje s homografi. V naslednji fazi sinteze govora računalnik pomaga s fonemi, da besedilo pretvori v zaporedje zvokov. Zadnja faza vključuje uporabo človeških posnetkov ali osnovnih tehnik ustvarjanja zvoka, da posnemajo človeški govorni mehanizem in preberejo celotno besedilo. Ena izmed priljubljenih vej sinteze govora je avdio-vizualna sinteza govora ali multimodalna sinteza govora, ki uporablja animirani obraz, tesno sinhroniziran za dopolnitev sintetiziranega govora. Multimodalna sinteza govora vključuje tudi dodatne funkcije, kot so neverbalne znake govora, ki pomagajo pri boljši natančnosti sporočanja uporabnikovih besed. Številni sistemi za sintezo govora uporabnikom omogočajo izbiro vrste glasu, kot je moški ali ženski glas.
Večina sistemov sinteze govora je sposobna brati besedila in jih zelo inteligentno brati, čeprav je glas včasih lahko dolgočasen. Govorna sinteza pa naj bi še razvila sposobnost polnega posnemanja širokega spektra človeških intonacij in kadenc.



