Înțelegerea limbii naturale este viitorul lui A.I. Recunoaștere vocală

$config[ads_kvadrat] not found
Anonim

Odată cu apariția capacității consistente a lui Alexa și a lui Siri de a-și asuma mai multe treburi (și de a deveni tot mai saturate), mulți se întreabă: ce urmează pentru înțelegerea limbajului natural și pentru interfețele voce conversaționale?

Există mai multe companii în gât și în gât în ​​această cursă. Există Wit.ai, compania Facebook achiziționată - puteți să jucați cu demo. (Incearca aceasta comanda: "Vreau sa ma uit la pisici"). Apple are HomeKit-ul si, cu el, face ceea ce Apple are cel mai bine - lovind fundul. Amazon este, de asemenea, în partea din față cu echo Echo și Echo Dot echipate cu Alexa.

O companie fierbinte pe calea înțelegerii limbajului natural este MindMeld. MindMeld oferă capacitățile sale de înțelegere a limbajului natural altor companii care doresc să adauge interfețe vocale inteligente cu produsele, serviciile sau dispozitivele lor. Compania din San Francisco oferă partenerilor opțiunile de infrastructură și personalizare, astfel încât dispozitivele lor să poată avea proprii asistenți personali, bine reglați. MindMeld a anunțat recent un astfel de parteneriat cu Spotify, dar lucrează și cu companii de automobile, cu agențiile de apărare, cu companii de comerț electronic și multe altele. (Și, firește, nu este în măsură să împărtășească multe detalii despre astfel de parteneriate.)

Invers a vorbit cu Sam Vasisht al lui MindMeld despre stadiul domeniului recunoașterii vocii - dar el a fost rapid să sublinieze faptul că "recunoașterea vocii", ca întreprindere, este acum un "subiect mundan". În prezent, este vorba de "înțelegerea limbajului natural. "Recunoașterea vocală a atins aproape zenitul: după 50 de ani de dezvoltare, AI pot recunoaște în mod eficient vorbirea. Aceste sisteme sunt aproape la fel de bine decât oamenii la locul de muncă și, cu siguranță, vor depăși în curând pe muritori.

Următorul pas previzibil, atunci - la fel ca dezvoltarea unui copil - este de a învăța aceste sisteme a intelege limba pe care o pot recunoaște acum. "Acest om rostește cuvintele; acestea sunt cuvintele "este un strigăt departe de", înțeleg ce spune acest om; permiteți-mi să ajut."

Și acest pas și dezvoltarea ulterioară necesită interpretarea sens: Imitarea modului în care mintea umană procesează informații verbale. Există două părți la această ecuație. Primul este intenția: Care este scopul sau dorința omului în a vorbi această propoziție? Un computer care poate extrage intenția de la o propoziție pronunțată poate "înțelege" că omul vrea să afecteze X sau interacționați cu y. Împreună cu acest proces este a doua parte a ecuației: entitate. A.I. trebuie să știe cum să determine entitatea care se adresează, obiectul intenției omului.

Pentru a face acest lucru, MindMeld nu este (așa cum am presupus sau am sperat) angajând filozofi. Utilizează experți în limbajul natural, dar o mare parte din specialiștii de la AI. Procesul de "învățare" este relativ realist. Dacă predați sistemul pentru a înțelege ordinele de cafea, trebuie să arătați sistemului toate modurile diferite în care oamenii ar putea să comande, probabil, cafea.

- Aș vrea o mocha.

"Aș putea să văd o ceașcă de joe?"

- Doar o cafea mare pentru mine.

Și acolo intră experții de limbă naturală - lingviștii. Dar chiar și asta nu mai este necesar pentru că putem colecta datele. Aceste instrumente vă permit să adresați mii de oameni aceeași întrebare și să le compilați răspunsurile. Apoi, doar hrăniți aceste răspunsuri în AI și Voila: A.I. pot reacționa la o gamă largă de întrebări posibile. "Din mii de interogări, acum putem doar să vedem în mod automat cum ar putea fi generate miliarde de alte interogări", spune Vasisht.

Invers a întrebat Vasisht, care a fost mult timp insider în A.I. și tărâmul înțelegerii limbajului natural, să speculeze pentru noi.

Poate MindMeld să participe la un dialog extins? De exemplu, dacă pun o întrebare ulterioară, înțelegeți și continuați să răspundeți?

Da. Aceasta face parte din design. Dacă cineva întreabă o întrebare incompletă - de exemplu, dacă comandă cafea și nu precizez dimensiunea cafelei pe care o doresc, ea se va întoarce și va spune: "Ce mărime de cafea aveți vrei?"

Vreți să așteptați progrese în urma testului Turing?

Cred că suntem destul de aproape de el. Adică, IBM Watson a făcut-o Primejdie!, și cred că a fost un exemplu foarte bun. Suntem la acel moment: se apropie foarte mult. Așa cum, acum, în ceea ce privește recunoașterea vorbirii, suntem la punctul în care mașinile sunt la fel de bune ca și ființele umane, cred că vom fi - într-adevăr, în următorii trei până la cinci ani - într-un punct în care majoritatea acestor voci de conversație sistemele vor fi considerate a fi la fel de bune ca și oamenii.

Ce fel de lucruri de automatizare acasă face MindMeld?

Putem aplica tehnologia noastră pentru orice tip de produs, orice fel de serviciu, orice tip de domeniu de date. Tehnica de acasă este una dintre acestea. În casă aveți controlul iluminării, termostatul, sistemele de securitate, sistemele audio, sistemele video, toate aceste lucruri. Putem controla oricare dintre sistemele cu condiția să existe interfața corespunzătoare.

Ce vrei să te poți conecta la MindMeld în casa ta?

Cred că mai multe cazuri de utilizare avansate - cum ar fi să vorbesc cu spotify-ul meu pentru a spune "Redați-mă lista de redare Rolling Stones" sau "Joacă-mă muzica clasică în această seară" - lucrurile astea ar fi … minunate.

Orice mai neașteptat sau mai neașteptat decât cel pe care doriți să îl controlați cu vocea voastră?

Lucrurile pe care ți le-am descris sunt lucrurile pe care le consider iminente. Cu alte cuvinte, acestea se vor întâmpla foarte curând. Ceea ce nu se va întâmpla imediat, cred, ar fi lucruri precum microunde, mașini de cafea și frigidere. Având aceste tipuri de aparate să fie controlate - așa că pot spune în esență, "Mașina mea de cafea este gata pentru a face cafea? Porniți mașina de cafea "și dacă nu a fost pregătită, ar trebui să reveniți și să spuneți" Îmi pare rău, dar mașina dvs. de cafea nu este gata "- nu există încă o astfel de inteligență. Acesta va fi Sfântul Graal: Unde practic orice dispozitiv vă poate vorbi și vă va spune ce poate și ce nu poate face. Dar nu suntem încă acolo.

Ce credeți că are industria înapoi?

Acestea sunt aparate extrem de ieftine, acum. Vreau să spun, acestea sunt aparate pe care le poți cumpăra pentru aproape nimic. Acum zece ani costa mult mai mult.Deci, construirea de noi caracteristici este ceva care adaugă la costurile acestor dispozitive. În cele din urmă, propunerea de valoare actuală este foarte puternică; majoritatea acestor producători nu sunt înclinați să adauge noi caracteristici, cu excepția cazului în care se află la un punct de cost foarte scăzut.

Cred că este un aspect al acesteia. Celălalt aspect este că vorbim despre conectarea acestor dispozitive. Deci, trebuie să existe mai mult decât o voce de utilizare pentru a conecta aceste dispozitive. Trebuie să existe mai multe capabilități care trebuie să se desfășoare pe acea conexiune înainte de a deveni viabile.

Știți despre o companie care lucrează la această ultimă capacitate?

Multe companii de semiconductoare lucrează la rețele de microfon foarte ieftine. Ce fel de lucru pe care îl puteți încorpora - la un cost foarte scăzut, pe aproape orice dispozitiv sau aplicație - care ar permite să fie o intrare vocală. Și nu trebuie să stați lângă aceste dispozitive - puteți vorbi de la 10 de metri distanță. Construirea acestei capacități - cred că acesta este punctul de plecare. Și cred că va permite oamenilor să înceapă să pună microfoane pe dispozitive, iar apoi vor fi urmate celelalte capabilități avansate. Dar acum, nu cunosc nici o companie care construiește o astfel de mașină de cafea inteligentă sau un cuptor inteligent cu microunde sau o mașină de spălat.

Care este cea mai bună estimare a dvs. atunci când avem case complet inteligente, apartamente complet inteligente?

Astăzi, de fapt, avem aproape toate subsistemele esențiale din casă pe care oamenii doresc să le automateze, care sunt capabile să fie automatizate. Acestea includ lumini, termostate, sisteme de securitate, uși de garaj, încuietori de la ușile din față - lucruri de genul asta. Toate aceste lucruri se pot face. Problema este cu adevărat în jurul punctelor de preț. Acestea sunt încă la punctul de preț în care sunt în primul rând adoptivi timpurii și oameni care au o nevoie foarte mare pentru ei. Dar punctele de preț pentru aceste lucruri scad dramatic, foarte repede. Cred că probabil vom obține aceste subsisteme pe piața de masă în următorii câțiva ani.

Celelalte lucruri despre care am vorbit - automatizarea aparatelor cu costuri foarte scăzute - cred că acestea sunt probabil cel mai devreme în intervalul de timp de cinci până la șapte ani. Mai mult de 10 ani, înainte ca acestea să devină realitate. Dar, așa cum am spus mai înainte, acestea sunt lucruri care vor necesita o serie de alte lucruri care să se unească. Și s-ar putea întâmpla mai devreme dacă aceste diferite ingrediente se reunesc împreună mai devreme.

Ce crezi că un apartament din New York sau San Francisco ar arăta, de exemplu, în 2050?

2050! Wow. Cred că vom fi pe deplin acolo. Ce fel de lucruri vedeți în filmele științifico-fictive - unde puteți vorbi destul de mult cu fiecare sistem din casă și controlați totul cu voce - cred că aceste tipuri de capabilități vor fi răspândite. Desigur, în orașe ca New York și San Francisco.

$config[ads_kvadrat] not found