Domov Razvoj Kaj je besedilo v govor (tts)? - definicija iz tehopedije

Kaj je besedilo v govor (tts)? - definicija iz tehopedije

Kazalo:

Anonim

Opredelitev - Kaj pomeni besedilo v govor (TTS)?

Besedilo v govor (TTS) je postopek modeliranja v naravnem jeziku, ki za avdio predstavitev zahteva spreminjanje enot besedila v enote govora. To je nasprotje govora do besedila, kjer tehnologija sprejema govorjene besede in jih poskuša natančno zapisati kot besedilo. Besedilo v govor je zdaj pogosto v tehnologijah, ki si prizadevajo za zvočni izhod iz digitalnega besedila za pomoč tistim, ki ne znajo brati, ali za druge vrste uporabe.

Techopedia razlaga besedilo v govor (TTS)

Razvijanje zmožnosti besedila v govor vključuje nekaj edinstvenih izzivov. Zlasti v angleškem jeziku, kjer ima veliko homonimov različno izgovorjavo, se računalniški programi opirajo na verjetnostno modeliranje, da ugibajo želeno izgovor besede v digitalnem besedilu. Program mora pretvoriti tudi enote besedila v foneme, najmanjše enote izgovora govora. Rezultat tega je, da je veliko tehnologij za govorno govorjenje manj kot nezmotljivih, čeprav so razvijalci na teh tehnologijah že nekaj let dosegli velik napredek.


Sčasoma so strokovnjaki opazili nekaj najboljših praks za razvoj TTS. Sem spadajo fonemske podlage in kokanacionalen pristop s prediktivno analitiko. Najboljši programi lahko delujejo tudi z minimalnimi potrebami pomnilnika in jih je enostavno nastaviti. Razvijalci še naprej delajo na virih TTS za kateri koli jezik in se spopadajo z velikimi izzivi dvoumnosti in drugimi ovirami za natančnejše upodabljanje.

Kaj je besedilo v govor (tts)? - definicija iz tehopedije