V:
Kakšna je razlika med govorom in besedilom ter klepeti?
A:Številne pomembne razlike med tehnologijami govora v besedilo in chatboti so del tega, kar se preučuje v hitrem razvoju projektov chatbot in voicebot.
Tehnologija govor v besedilo je preprosto tista, ki pretvori besedni govor v besedilo na digitalni strani. To je njegova popolna funkcija, oblikovanje pa ni preprosto. Za pretvorbo besednega govora v besedilo mora tehnologija razstaviti besede in stavke v posamezne foneme in z njimi sodelovati po zapletenih algoritmih, da ustvari natančno besedilo in predstavlja tisto, kar je govornik povedal.
Po drugi strani so chatboti tehnologije, ki dosegajo cilj komuniciranja s človekom. Obstajata dve vrsti klepetov: besedilni klepeti in glasovni roboti. Besedilni klepeti so že precej daljši, saj ne potrebujejo elementa govora v besedilo, ki ga govorni roboti uporabljajo.
Glavna razlika med tehnologijo govora v besedilo in chatboti je obseg. Kot že omenjeno, mora vsa tehnologija govora v besedilo prepisati besedni govor. Po drugi strani pa mora chatbot sprejemati govor v kakršni koli obliki, da ga razume, in zagotoviti odgovore, s katerimi želi preizkusiti Turingov test - test, ali tehnologija lahko človeka zavede, da misli, da je on ali ona pogovor z drugo osebo.
Glede na to je chatbote veliko lažje ustvariti kot glasovne. Klepetalnik sprejme človekovo besedilo in nudi besedilni odgovor. Celo razmeroma enostavni klepeti so lahko ljudem zagotovili zanimive in prijetne rezultate od konca osemdesetih do začetka devetdesetih let.
Po drugi strani pa mora glasovni govor prevzeti besedni govor, ga pretvoriti v besedilo, ga preveriti za natančnost, pripraviti odziv in ta odziv iz strojnega jezika zgraditi v slišni govor. To veliko število dokaj pomembnih nalog pomeni, da ima govorni računalnik vgrajeno veliko računalniške moči in veliko zasnove.
Projekti, kot so Siri, Cortana in Alexa, prikazujejo del predloge tehnoloških tehnologij. Prav tako ponazarjajo, da je ta tehnologija še v povojih. Čeprav se Alexa in druge tehnologije lahko ustno odzovejo na človeški govor, niso izjemno sposobne v smislu, ki ga na splošno povezujemo z verbalnim človeškim govorom. Z drugimi besedami, odzivi, ki jih lahko zagotovijo te tehnologije, imajo kar nekaj omejitev. Današnja generacija osebnih asistentov ima celo omejeno sposobnost, da na primer ustvarijo govor v besedilo, na primer za prepisovanje e-pošte ali pomoč nekomu pri pisanju eseja brez uporabe rok. Nekateri specifični programi govornega besedila na trgu to počnejo bolje kot Siri ali Cortana, verjetno zaradi dodelitve sredstev. Vendar obstajajo znaki, da se bo napredek govornih funkcij kmalu začel pojavljati - na primer Amazonova Lex platforma, ki omogoča studijsko okolje za gradnjo tovrstnih tehnologij.
Tobias Goebel v pametnem in poučnem eseju na to temo govori o razliki med temi tehnologijami in pri tem razume, kako govoriti v besedilo, in ki ga razumejo, ki naj bi ga opravljali chatboti.
"Medtem ko odpravljanje potrebe po prepoznavanju govora nepomembno olajša stvari, je glavni izziv za oblikovanje delujočih botov v razumevanju naravnega jezika, " piše Goebel.
Goebel identificira tudi številne trenutno akterje v panogi:
Vodja na trgu za prepoznavanje govora je Nuance, ki stoji za znanimi sistemi, kot je Dragon NaturallySpeaking za diktatom na osebnem računalniku, ki je že od devetdesetih, pa tudi Siri: nalogo prepoznavanja / prepisovanja govora, ki jo izvajajo v oblaku Apple, uporablja Nuanska tehnologija v zakulisju. Druge so LumenVox, Verbio ali Interactions, vendar je prepoznavanje govora zdaj na voljo tudi kot storitev v oblaku prek API-jev po meri Amazon, Google, Microsoft in IBM.
Ko se chatboti razvijajo, se domneva, da se bo njihovo razumevanje še naprej povečevalo na neki poti - in tudi večinoma se domneva, da bo več tehnologij bot prešlo iz besedilnih vmesnih v verbalne vmesnike, kar bo zahtevalo dodatne količine računalniške moči.