"Setează alarma la ora 8 AM." Bine, sun acum pe mama.
"Nu, setează alarma la ora 8 AM."
OK, sun Nu răspunde niciodată, acum
"Nu, nu, nu face asta!"
Îmi pare rău, dar nu te pot ajuta cu asta încă.
Apelarea telefonului...
Câți dintre voi ați experimentat asta?
Vocile noastre sunt diverse, complexe și variabile și le folosim pentru a obține ceea ce dorim unii de la alții. Dar comenzile vocale, un fenomen tehnic relativ nou, își propun să perfecționeze capacitatea de a comunica în mod clar, ceea ce dorim de la produsele noastre.
Trăim în epoca de proiectare și dezvoltare a serviciilor, care a adus cu ea nenumărate posibilități de a crea experiențe intuitive, centrate pe om, pe care atât de mulți oameni le iubesc. Dar dezvoltarea rapidă a tehnologiei a adus cu ea și o creștere a nevoilor noastre, și implicit satisfacerea acestora într-un ritm cât mai rapid și cu costuri cât mai reduse. Pentru a răspunde avalanșei de nevoi resimțite, mai mult sau mai puțin fundamentate, au fost inventate dispozitivele de voce. Un exemplu de necesitate reală, căreia aceste dispozitive îi pot răspunde prin ameliorări substanțiale, se referă la viața persoanelor cu diferite dizabilități. Dincolo de nevoi, există și preocuparea de a evita oboseala cauzată de statul în fața ecranelor. În acest sens, comanda vocală reprezintă deocamdată o soluție salvatoare...
Interfața vocală, Voice UI, nu se rezumă numai la popularele dispozitive fabricate de Apple, Google și Amazon. Fie că vorbim despre VUIs (Interfațe vocale) pentru aplicațiile mobile sau pentru dispozitive specializate din casele inteligente, interacțiunile vocale devin tot mai frecvente în tehnologia de azi.
Interfețele vocale (VUI) pot fi vizuale, auditive și tactile, primare sau suplimentare, permițând interacțiunea vocală dintre oameni și dispozitive. O interfață vizuală nu e neapărat necesară în cazul VUI. Ea poate fi complet auditivă sau tactilă ( de exemplu, prin apelul la vibrații).
Deși există un spectru larg VUI, toate tipurile împărtășesc un set comun de fundamente UX. Serviciile Web și "Internet of Things" oferă diverse oportunități pentru voce.
În prezent, domenii precum Recunoașterea automată a vorbirii (Automatic speech recognition), înțelegerea limbajului (natural language understanding) și textul în vorbire ( text to speech) sunt folosite tot mai des de către utilizatori, ceea ce face știința din ce în ce mai accesibilă.
Revoluționara Inteligență Artificială (Artificial Inteligence) permite ca VUI să fie și mai performant, prin prisma faptului că VUI-urile învață și se adaptează la discursul, modelele, preferințele și contextele utilizatorului. Toate aceste progrese conduc la un punct de inflexiune în tehnologia vocii, iar driverul de bază suntem chiar noi, oamenii, nu o tehnologie. Salutăm experiențele vocale pentru că suntem conectații și prin vorbire.
Comanda vocală a utilizatorilor constă în trei factori cheie: intenție, vorbire, și slot .
Intenția reprezintă obiectivul mai larg al comenzii vocale a unui utilizator, iar aceasta poate fi de o calitate superioară, fie de una inferioară. Utterance sau modul în care utilizatorul exprimă o comandă reflectă felul în care utilizatorul își exprimă cererea. De exemplu, știm că utilizatorul dorește să redea muzică pe televizor, spunând "Cântă ... pe televizorul din camera de zi ". Dar acesta nu este singurul mod în care un utilizator ar putea face această solicitare. De exemplu, utilizatorul putea ,de asemenea, să spună: "Vreau să aud muzică ... pe televizorul de cameră".
Designerii ca și inginerii trebuie să ia în considerare fiecare variație a cuvântului. Acest lucru va ajuta motorul AI să recunoască cererea și să o conecteze la acțiunea sau la răspunsul potrivit.
Uneori, o singură intenție nu este suficientă, fiind necesare mai multe informații de la utilizator pentru a putea satisface cererea. Alexa numește acest lucru "slot", iar sloturile sunt ca și câmpurile lexicale tradiționale, ceea ce înseamnă că ele pot fi opționale sau obligatorii, în funcție de ceea ce este necesar pentru a completa solicitarea.
În cererea de mai sus slotul este "relaxant", deoarece cererea poate fi completă fără ea, acest slot este opțional. Pentru rezervarea unui taxi, de exemplu, slotul ar fi destinația și ar fi necesar.
Opțional, se suprascriu toate valorile implicite. Un exemplu ar fi o solicitare de adăugare a unei întâlniri în calendar cu Jane Doe pentru următoarea săptămână care ar suprascrie valoarea implicită "cât mai curând posibil".
Aveți tehnologia, toate mijloacele necesare pentru a face acest lucru; v-ați gândit la serviciul sau produsul pentru care proiectați?
Ați scris "conversația" dorită?
Un utilizator va căuta în mod obișnuit calea cea mai ușoară de a finaliza o sarcină, dar definiția lor de "ușor" poate varia în funcție de context și situație.
Examinați-vă propria experiență și familiaritatea cu interfețele vocale și lingvistice.
Vorbiți cu persoanele cunoscute despre contextul în care ar dori să utilizeze aceste interfețe.
S-ar putea să doriți să creați o diagramă- secvență, care să reprezinte modelul de interacțiune.
Luați în considerare riscurile de securitate pe care le poate introduce în sistem.
Fiți clar cu privire la cronologie și subiecte, atunci când interfața nu este cea mai bună opțiune.
Alegeți elementele idiosincrasice din serviciului vostru și identificați modul în care sunt exprimate în interfață.
Fiți la curent cu prejudecățile existente și evaluați sau ajustați în consecință.
Luați în considerare limitările și circumstanțele specifice - cum ar fi accentele, impedimentele de vorbire și gospodăriile bilingve - asigură un UI vocal centrat pe om prin proiectarea pentru a satisface aceste nevoi speciale.
Păstrați comunicarea simplă și conversația.
Confirmați când o activitate a fost finalizată.
Practic, fiți utilizatorii de testare de tip A, a dispozitivelor VUI existente și faceți o listă a lucrurilor care vă plac și nu vă plac și faceți-le mai bine.
Nu avem atât de multe limitări ca acum zece ani!