De ce A.I. Pot lupta pentru a înțelege arabă

$config[ads_kvadrat] not found

Cum propriile minți ne pot chinui și strica viața

Cum propriile minți ne pot chinui și strica viața
Anonim

În lumea inteligenței artificiale, datele sunt regele. Cu cât aveți mai mult, cu atât instrumentele dvs. devin mai bune, deoarece sistemele sunt capabile să "învețe" mai multe despre ceea ce se așteaptă. Dar, în funcție de platformă, A.I. desenează date, unele limbi pot fi mai bine reprezentate decât altele, potrivit Miriam Redi, cercetător științific pentru laboratoarele Yahoo.

"De exemplu, ca și Flickr, de unde ne dăm datele, unele limbi sunt foarte puțin reprezentate", a declarat Redi, care a vorbit joi la Summitul de învățare de la Deep. "Avem engleza, milioane de imagini pentru engleza, dar putem avea 100.000 pentru arabă".

Echipa lui Redi lucrează la un instrument care poate identifica elementele non-vizibile ale imaginilor, cum ar fi valorile culturale și conotațiile emoționale. Instrumentul analizează textul atașat imaginilor disponibile public pe Flickr. De-a lungul timpului, A.I. începe să înțeleagă de ce cineva poate eticheta o imagine "petrecere fericită" sau "moment ciudat", dar aceste idei vor deveni tot mai exacte, deoarece instrumentul analizează mai multe imagini.

"Din păcate, precizia pentru detectarea sentimentului în imaginile pentru limbile arabe tind să fie mai mică, deoarece nu avem suficiente date", a spus Redi.

În limbile care aveau cantități mai mari de date, echipa lui Redi a observat câteva modele interesante. Limbajele limbii franceze, precum cea franceză și spaniolă, au avut tendința de a se exprima în moduri similare, în timp ce limba italiană pare a fi singura limbă în care utilizatorii au identificat imagini cu termenul "evaziune fiscală".

Limitările lingvistice rămân încă o problemă pentru A.I. cercetători. Oricine a folosit Google Traducere va ști că limbajul de comutare nu este niciodată la fel de simplu precum suna. Cu toate acestea, evoluțiile noi se schimbă, anunțând Facebook în această vară că se apropie de visul său de rețea socială unică, traducând în mod automat texte pentru utilizatori.

Evoluțiile în înlăturarea barierelor lingvistice pot contribui la promovarea comunicării internaționale, însă pentru proiectele ca Redi, nu există un substitut real pentru datele sentimentului generat de om.

$config[ads_kvadrat] not found