Algoritmul MIT nou poate prezice interacțiunile umane înainte ca acestea să devină stricate

$config[ads_kvadrat] not found

Shoshana Zuboff privind capitalismul de supraveghere | Documentar VPRO

Shoshana Zuboff privind capitalismul de supraveghere | Documentar VPRO
Anonim

Incapacitatea noastră de a citi alte persoane a condus la o serie de cinci eșecuri eșuate și lipsuri de sărutări. Chiar și după o experiență de viață, interacțiunile umane sunt greu de anticipat. Dar cercetătorii de la Laboratorul de Informatică și Inteligență Artificială de la MIT consideră că pot ajuta: Cu un nou algoritm de învățare profundă care poate prezice când doi oameni îți vor îmbrățișa, sărute, scutura mâinile sau cinci, au făcut un pas mare către un viitor fericit lipsit de aceste momente ciudate.

Ei speră că noul lor algoritm - instruit pe 600 de ore de videoclipuri YouTube și emisiuni TV ca Biroul, Scrubs, Teoria Big Bang, și Neveste disperate - poate fi folosit pentru a programa mai puțini roboți social awkward și pentru a dezvolta căști în stil Google Glass pentru a sugera acțiuni pentru noi înainte de a avea chiar șansa de a pierde. În viitor, își vor imagina, nu veți mai face niciodată o șansă de a face o plimbare cu colegul dumneavoastră.

Realizând că roboții învață să fie sociali în aceleași feluri pe care le facem a fost cheia succesului algoritmului. "Oamenii învață automat să anticipeze acțiunile prin experiență, ceea ce ne-a făcut interesați să încercăm să împrăștiem computerele cu același tip de bun simț", spune CSAIL Ph.D. studentul Carl Vondrick, primul autor al unei lucrări aferente, care a fost prezentat săptămâna aceasta la Conferința Internațională privind viziunea computerizată și recunoașterea modelelor. "Am vrut să arătăm că doar prin vizionarea unor cantități mari de video, computerele pot câștiga suficiente cunoștințe pentru a face predicții despre împrejurimile lor".

Vondrick și echipa lui au învățat multiplele "rețele neuronale" ale algoritmului pentru a analiza cantități uriașe de date în acest caz, orele de la cele cinci înalte ale lui Jim și Pam și ale lui Kiss Mike și Susan pe sine. Luând în considerare factori cum ar fi brațele întinse, o mână ridicată sau o privire prelungită, fiecare dintre rețelele neuronale a ghicit ce se va întâmpla în următoarea secundă, iar consensul general al rețelelor a fost considerat ca "predicție" finală în studiu.

Algoritmul a obținut peste 43% din timp. În timp ce aceasta ar putea să nu pară suficient de mare pentru a garanta că interacțiunile noastre zilnice vor fi mai puțin ciudate, este o mare îmbunătățire a algoritmilor existenți, care au o precizie de doar 36%.

În plus, oamenii pot prezice acțiunile doar 71% din timp. Avem nevoie de tot ajutorul pe care îl putem obține.

În cea de-a doua parte a studiului, algoritmul a fost predat pentru a prezice ce obiect - capcane interne de sitcom ca telecomenzi, vase și coșuri de gunoi - ar apărea în scenă cinci secunde mai târziu. De exemplu, dacă se deschide o ușă cu microunde, există o șansă relativ ridicată pentru o cană.

Algoritmul lor nu este suficient de precis pentru Google Glass încă, dar cu co-autorul Antonio Torralba, Ph.D. - finanțat de un premiu de cercetare al Facultății Google, iar Vondrick lucrează cu un doctorat Google. părtășie - putem paria că ajunge acolo. Versiunile viitoare ale algoritmului, prezice Vondrick, pot fi folosite pentru a programa roboții să interacționeze cu oamenii sau chiar să învețe camerele de securitate să se înregistreze când o persoană se prăbușește sau se rănește.

"Un videoclip nu este ca o carte" Alege-ți propria aventură "unde poți vedea toate căile potențiale", spune Vondrick. "Viitorul este în mod inerent ambiguu, așa că este interesant să ne provocăm să dezvoltăm un sistem care să utilizeze aceste reprezentări pentru a anticipa toate posibilitățile".

$config[ads_kvadrat] not found