Domov Programska oprema Tehnologija glasovnega prepoznavanja: koristna ali boleča?

Tehnologija glasovnega prepoznavanja: koristna ali boleča?

Kazalo:

Anonim

Ste že kdaj poklicali podjetje, da bi dobili kakšno pomoč ali plačali svoj račun, da vas pozdravi le prijeten posnet glas, ki želi pogovoriti z vami - vendar ne morete razumeti polovice tega, kar govorite? Ali ste morda lastnik iPhone, in čeprav se je Siri najprej zdela dobra zaveznica, ste se zavedali, da včasih (v redu, bodimo iskreni, pogosto) tega preprosto ne razume? Tehnologija za prepoznavanje glasu (VRT), znana tudi kot govor v besedilo, sodi v skupno past: ima potencial, da je neverjetno kul (in fant, ali se za njo ukoreninimo), pogosteje pa gre za ščetkanje zob. vaja v frustraciji.


Nekoč ideja, ki je spadala v sfero znanstvene fantastike, je prepoznavnost glasu zrasla od svojega začetka v petdesetih letih prejšnjega stoletja, ko je bil sistem Bell Laboratories Audrey zasnovan za prepoznavanje števk, izrečenih v en glas, v sodobno mrežo pogovorne elektronike, s katero zdaj komuniciramo vsakodnevno - z mešanimi rezultati.

Če želite govoriti s človekom, pritisnite 0

Mnoga današnja podjetja zdaj uporabljajo sisteme, imenovane interaktivni govorni odziv (IVR) za obravnavo klicev s strankami. Najpogosteje se uporabljajo v menijih za glasovno krmarjenje, vendar nekatera podjetja uporabljajo sisteme IVR, ki imajo dostop do informacij o računu stranke in odgovarjajo na manjša vprašanja. Programska oprema v meniju IVR ima običajno omejen besednjak, ki je lahko omejen na "da", "ne" in številke. Bolj zapleteni sistemi lahko prepoznajo besede in stavke, specifične za podjetje.


Ti sistemi postajajo bolj priljubljeni - vsaj za podjetja - iz preprostega razloga: so stroškovno učinkoviti. Glede na poročilo iz leta 2010, ki ga je objavil Wall Street Journal, običajni klic stranke, ki doseže zastopnika, stane med 3 in 9 dolarjev, medtem ko klic, opravljen prek avtomatiziranega sistema, stane le pet do sedem centov. In seveda, da se računalniški programi ne naveličajo, pokličejo bolne ali postanejo frustrirani pri strankah (čeprav stranke zagotovo postanejo frustrirane zaradi njih!).


Na srečo to ne pomeni vedno, da IVR odvzema delovna mesta ljudem - ali vsaj, da vsi izginjajo iz klicnih centrov. Ti pomočniki z glasovnim aktiviranjem omogočajo ljudem za pomoč strankam, da so bolj učinkoviti z usmerjanjem klicev in odgovarjanjem na preprosta vprašanja.


Seveda za človeške uporabnike, ki komunicirajo s temi tehnologijami, ni vedno gladko jadranje. Tehnologija pomaga izboljšati običajne težave v tehnologiji IVR, na primer težave z poudarki, vendar je odstranjevanje avtomatiziranih sistemov še vedno pogosta tema v spletu. Oglejte si ta komični skeč o dvigalu, opremljenem s prepoznavanjem glasu, ki poudarja frustracijo, ki jo lahko povzročijo okvare v sistemih IVR.

Aplikacije za osebne telefone: Siri, Google Now

Večina ljudi je seznanjena s prepoznavanjem glasu za pametne telefone. Medtem ko večina najnovejših modelov telefonov prihaja z VR, je njihova priljubljenost in razvpitost popustila, ko je Apple leta 2011 predstavil Siri, blago sarkastično glasno aktiviran "osebni asistent" za iPhone 4S. Google je kmalu ustvaril neposrednega tekmeca: Google Zdaj za Android Jelly Bean OS. Oba sistema odlikujeta ženski glas in izpopolnjene funkcije prepoznavanja, ki uporabnikom omogočajo, da "govorijo" s svojimi telefoni s priložnostnim jezikom.


Toda čeprav so ti sistemi bistveno bolj izpopolnjeni in funkcionalni kot njihovi predhodniki, tudi kažejo, da ima tehnologija še dolgo pot. Šale o Sirijevem neuspehu so postale priljubljen internetni meme. En mož je celo tožil Apple zaradi lažnega oglaševanja v zvezi s Sirijevimi zmožnostmi.


Mogoče je zato, čeprav je Apple ustvaril Siri kot napredno in poučno, je VR programska oprema tudi nekoliko na trdni strani. Če na primer govorite o eni od najbolj zloglasnih linij obveščevalne tehnologije v zgodovini kinematografa iz filma iz leta 1968 "2001: vesoljska odiseja" - "odprite vrata pod zalivom" - Siri se bo odzvala bodisi z odzivno vrstico iz filma, " Žal mi je (vaše ime), bojim se, da tega ne bom mogel storiti, "ali bolj sarkastično", očitno obveščevalni agenti tega ne bomo nikoli preživeli. "


Klicanje vas po imenu je le ena od funkcij, ki skuša Siri olajšati ljubezen in nekoliko bolj človeško. Pomočnik VR lahko sledi glasovnim ukazom za klicanje, diktiranje in pošiljanje besedil, izvajanje internetnih iskanj informacij, iskanje bližnjih trgovin, dajanje navodil za vožnjo in še kaj, ne da bi se bilo treba ničesar dotikati. Telefon hkrati izgovori odgovore in se prikaže na zaslonu.


Google Now, VR del platforme Android Jelly Bean, je zelo podoben Siri. Sistem ponuja enake široke zmožnosti prepoznavanja s prevajanjem priložnostnega govora v ukaze, ki uporabnikom omogočajo klicanje, pošiljanje besedil, izvajanje iskanj, izvajanje izračunov in pretvorb, zajemanje definicij besed, nastavitev alarmov, predvajanje pesmi ter pridobivanje zemljevidov in navodil.


Pri osebnih glasovnih pomočnikih, kot sta Siri in Google Now, so prednosti očitne. Vse od klicanja in pošiljanja sporočil SMS do iskanja in zabave je hitrejše in lažje. Povejte samo, kaj želite, in VR aplikacija večinoma za vas. Prostoročna tehnologija VR je še posebej koristna med vožnjo. In čeprav je veliko ljudi odpravilo pomanjkljivosti Siri in pisci trdijo, da je zmožnost Googlovega Asistenca, da v bistvu vodi življenje uporabnikov, grozna in malce žaljiva, večina ljudi še vedno meni, da so te futuristične tehnologije precej kul.


Seveda aplikacije za osebne telefone, kot sta Siri in Google Now, še zdaleč niso popolne - čeprav resnično kažejo, kam bi lahko v prihodnosti usmerili to tehnologijo. To pomeni, da se bomo tudi takrat, ko bo Siri našla napačen odgovor, verjetno smejali in ji oprostili, vedoč, da bo naslednja različica veliko boljša.

Kjer VR pade ravno

Če ste kdaj poklicali podjetje, boste opazili nekatere ovire pri komunikaciji. Nekateri programi uporabljajo robotski glas z besedilom v govor, ki napačno izgovarja besede in otežuje razumevanje stvari. Drugi imajo težave z občutljivostjo, zaradi česar programska oprema ne more obdelati tega, kar govorite, če ste preglasni, premehki ali ne premišljujete.


Poleg tega se mnogi ljudje še vedno ne počutijo udobno v pogovoru s strojem. Če izvedete nekaj iskanj na IVR, boste naleteli na sezname, ki so jih ljudje sestavili na način, kako zaobiti sisteme IVR in priti do "prave osebe". Te rešitve segajo od "nadaljuj s pritiskom na 0 za operaterja" do "prisega na stroj, dokler ne ugotovi človeka." Posledično se je velik del nedavnega razvoja sistemov IVR vrtel okoli tega, da so bolj prijetni za ljudi; s čimer so glasovi bolj naklonjeni in manj robotizirani, sistem je lažji za krmarjenje in klicateljem dal vedeti, kako dolgo bo trajalo vse od začetka do konca. To kaže, da je boljša tehnologija tu le polovica bitke; druga polovica je pridobivanje uporabnikov na krovu, ko govorijo s strojem.

Kaj ima prihodnost

Kljub tem izzivom tehnologija prepoznavanja glasu ves čas izboljšuje. Aplikacije, kot sta Siri in Google Now - pomanjkljivosti in vse -, so še vedno izjemno impresivne pri svojih zmogljivostih, zato številne družbe širijo zmogljivosti VR na druge aplikacije.


Nuance, ustvarjalci programske opreme za govorno besedilo Dragon NaturallySpeaking, so že razvili glasovni nadzor za televizorje in avtomobile, različice te tehnologije pa so vgrajene v nekatere Samsungove televizorje in razvedrilne sisteme SYNC, ki se uporabljajo v določenih Fordovih vozilih.


In ker Google in Apple še naprej najdeta nove uporabe tehnologij za prepoznavanje glasu, se bomo verjetno pogosteje pogovarjali z vsemi vsakodnevnimi stroji, od televizorjev do toasterjev. In še enkrat se zdi, da je bila znanstvena fantastika prava. Upamo le, da se bodo tisti pametni pisci zmotili ene stvari. Če te stroje prevzamejo, boste lahko naslednjič, ko boste Siri zaprosili, da "odpre vrata vrat podstavka", v velikih težavah.

Tehnologija glasovnega prepoznavanja: koristna ali boleča?