Poate rețeaua neuronală "super-umană" a Google să spună într-adevăr locația oricărei imagini?

$config[ads_kvadrat] not found

О предложении Владимира Путина заменить "Википедию". Вечерний Ургант. 06.11.2019

О предложении Владимира Путина заменить "Википедию". Вечерний Ургант. 06.11.2019
Anonim

Căutarea imaginilor este mai ușoară decât oricând. Dar dacă încercați să găsiți o imagine a unui lucru într-o locație care nu este total evidentă (deci nu piramidele egiptene sau sculptura gigantică de la Paris), este mai greu decât credeți - chiar și cu informațiile despre geolocație bazate pe ceea ce este în imagine.

Introduceți inginerul Google numit Tobias Weyand și o pereche de colegi. Potrivit unui nou articol din jurnal arXiv (pronunțată "arhivă"), trioul a construit o mașină de învățare profundă capabilă să identifice locația aproape a oricărei fotografii bazată exclusiv pe analiza pixelilor.

Pentru a obține o mașină pentru a realiza cu succes o astfel de sarcină, doriți să îi dați posibilitatea de a intui informații bazate pe indicii vizuale. Vrei să gândești, cu alte cuvinte, ca o ființă umană.

Weyand a început să dezvolte o rețea neurală artificială - un sistem de mașini proiectat să imite căile neurologice ale creierului, care îi permit să învețe, să proceseze și să reamintească informații cum ar fi o persoană umană. Acest nou sistem, PlaNet, se pare că este capabil să depășească performanțele oamenilor la determinarea locațiilor imaginilor, indiferent de setarea - fie în interior, fie în aer liber, și care prezintă orice tip de indiciu vizual unic sau nedescris.

Cum funcționează PlaNet? Weyand și echipa sa au împărțit o hartă a lumii într-o rețea care a pus peste 26.000 de forme pătrate în diferite regiuni, în funcție de numărul de imagini realizate în acele locuri. Locuri dense unde o mulțime de poze sunt luate în formă într-un pătrat mai mic, în timp ce regiunile mai mari și mai îndepărtate pot tăia în piețe mai mari.

Echipa a creat apoi o mare bază de date cu imagini deja geolocate - aproape 126 de milioane de fotografii diferite. Aproximativ 91 de milioane au fost folosiți ca set de date pentru a învăța pe PlaNet cum să afle ce imagine ar putea fi plasată în grila de pe harta lumii.

Apoi, rețeaua neuronală a fost însărcinată cu geolocalizarea celorlalte 34 de milioane de imagini din baza de date. În cele din urmă, PlaNet a fost setat pe un set de date de 2,3 milioane de imagini geotagged de pe Flickr.

Rezultatele? PlaNet ar putea determina țara de origine pentru 28,4% dintre fotografii și continent pentru 48%. În plus, sistemul ar putea să identifice o locație la nivel de stradă pentru 3,6% din imaginile Flickr și o locație la nivel de oraș pentru 10,1%.

Și PlaNet este mai bun la asta decât majoritatea oamenilor - chiar și cei mai mari globetrotteri. Weyand a înscris 10 persoane bine călătorite pentru a concura împotriva PlaNet într-un joc de etichetare a locațiilor de imagini din Google Street View.

"În total, PlaNet a câștigat 28 din cele 50 de runde cu o eroare de localizare mediană de 1131,7 km, în timp ce eroarea de localizare mediană umană a fost de 2320,75 km", au scris cercetătorii. "Acest experiment la scară mică arată că PlaNet atinge performanțe supraumane la sarcina de a geoloca scene din Street View."

Este aceasta reală? Un inginer Google a dezvoltat într-adevăr un "suprauman" A.I. sistem?

Când e vorba de imagini geolocante, poate. Și asta nu este prea surprinzător - punctul de la A.I. nu înseamnă să imităm în mod fundamental creierul uman în toate privințele, ci să depășim limitele umane în câteva moduri specifice de a îndeplini sarcini mult mai dificile. Deci, în acest sens, ceea ce spun cercetătorii este adevărat.

Totuși, este o întindere să numim PlaNet o "rețea neuronală". O formă ideală a acestui tip de tehnologie ar fi capabilă să învețe despre o geolocație mai mult decât imaginea. A.I. sistemele sunt capabile să scrie similări și să joace Super Mario, dar acest lucru este un lucru mic, comparativ cu un sistem ideal "master", care poate monitoriza automat și menține vitalitatea, gestiona transportul sau infrastructura energetică și multe altele.

$config[ads_kvadrat] not found