Majoritatea oamenilor asociază Legea americanilor cu dizabilități cu modificări fizice, de infrastructură care trebuie făcute clădirilor sau altor locuri, dar pe măsură ce definiția handicapului se extinde, oamenii își dau seama că „accesibil” se aplică și lucrurilor precum site-urile web și recunoașterea vocii.
În acest caz, gigantul tehnologic Google face efortul de a-și îmbunătăți software-ul de recunoaștere vocală cu Project Euphonia. Project Euphonia este o inițiativă de a înregistra mostre vocale de la voluntari și de a le analiza astfel încât persoanele cu SLA, tulburări neurologice și alte dificultăți de vorbire să își poată utiliza dispozitivele inteligente cu ușurința unui individ „tipic”.
De ce m-am oferit voluntar
O cordă vocală stângă paralizată și o limbă asimetrică din cauza unei tumori cerebrale au dus la afecțiunea mea de vorbire Disartrie. Vorbirea neclară și vocea slabă fac ca prietenii și familia să mă înțeleagă sau să mă audă - mai ales într-un spațiu aglomerat. Acest lucru m-a făcut un candidat principal pentru Proiectul Euphonia, așa că m-am oferit voluntar imediat ce am citit despre el. Înregistrând mostre pe un site web rudimentar, am reiterat 4.500 de fraze de la „Cum ajung la Mountain View, California?” La „Cântă melodii de Cardi B”.
Pe lângă îndeplinirea criteriilor proiectului Euphonia, m-am prezentat voluntar pentru că am fost prezentat pentru prima dată la programul principal de recunoaștere a vocii Dragon Naturally Speaking în 1997 - și a eșuat spectaculos. De-a lungul anilor, am încercat programe similare la Laboratorul Tehnologic de Asistență de la Spitalul de Copii din Boston, precum și versiuni actualizate ale acestuia balaurși, deși acest software a făcut pași mari, încă se străduiește să-mi identifice vocea.
Acest lucru este problematic din două motive: sunt un scriitor cu lipsă de abilități motorii fine, așa că scriu cu o mână sau încet cu două, dacă sunt obosit. Cu trei cărți de poezii auto-publicate, un memoriu și o colecție de povești nepublicate legate de numele meu, mă înfricoșez să mă gândesc cât de mult aș fi putut produce dacă tastarea nu ar fi o sarcină atât de dificilă din punct de vedere fizic.
Celălalt motiv pentru care recunoașterea vocală sub-pară îmi creează o barieră este din cauza proliferării produselor cu voce activă în case și pe telefoane. Doar folosind povestea mea, dacă aș putea accesa calculatoarele și dispozitivele inteligente așa cum ar fi menite să fie folosite, mi-ar oferi mai mult timp liber, mi-ar permite să îndeplinesc în totalitate sarcini și ar putea transforma modul în care trăiesc.
Project Euphonia: Cum funcționează?
Deci, cum funcționează Euphonia? După ce am descărcat o aplicație prototip cu un model personalizat de recunoaștere a vorbirii pe telefonul meu, am plasat telefonul lângă laptopul meu și l-am dictat; în timp ce făceam acest lucru, am urmărit tot ce am spus apărând în Google Doc pe laptopul meu. Am făcut asta câteva luni, am înregistrat fraze dintr-un roman pe care îl scriam și am corectat orice inexactități pentru Google folosind aplicația.
După încă câteva luni fără a înregistra fraze, am terminat prima schiță a unui roman - 20.000 de cuvinte - folosind aplicația. Acest lucru nu înseamnă că este impecabil; pentru fiecare oră pe care o scriu, trebuie să mă întorc și să petrec o oră făcând corecții minore. Dar nu mă deranjează, pentru că Euphonia se află într-o etapă beta și, în loc să scot 100 de cuvinte pe zi, generez 500 de cuvinte pe zi.
Apoi, există și faptul că Euphonia nu a fost concepută pentru procesarea textelor - este mai mult pentru comenzi declarative - și stilul meu de scriere este ceea ce ei numesc „pantser” (zboară lângă scaunul pantalonilor), așa că am o mulțime de pauze pentru că nu știu cum se va termina o propoziție - știi, ca Michael Scott. Când știu ce vreau să spun, totuși, cum ar fi în texte, e-mailuri sau oferind instrucțiuni asistentului meu, este de departe cea mai precisă recunoaștere a vorbirii pe care am folosit-o vreodată.
Când instituții precum Google dau o voce celor cu dizabilități în proiectarea arhitecturii viitorului, lăsându-i să rămână ei înșiși în loc să încerce să-i transforme în ceva „normal”, îmi dă speranța că, în era AI, umanismul va prevala.
Dacă doriți să vizitați site-ul web Project Euphonia sau aveți o deficiență de vorbire și doriți să contribuiți cu un eșantion de voce, puteți accesa acest link: https://sites.research.google/euphonia/about/