Această rețea neuronală AI de la Nvidia creează imagini false imaginare

$config[ads_kvadrat] not found

Dezbatere “Poti face bani din Fotografie in 2019?" - PhotoStory 2019

Dezbatere “Poti face bani din Fotografie in 2019?" - PhotoStory 2019
Anonim

Pe scurt, fotografia de sus seamănă cu o fotografie obișnuită a unei străzi obișnuite, luată fie dintr-o camă sau dintr-o persoană destul de nebună ca să se rătăcească pe drum pentru a face o fotografie a unei astfel de scenele luminoase.

Dar arătați-vă puțin mai aproape. Observați cum semnalul de trafic este ușor deformat sau cum unele mașini par fuzzy? E ceva în neregulă aici. Aceasta nu este o fotografie. Este o imagine creată în întregime de un A.I.

Oamenii de știință de la compania tehnologică Nvidia și de la Universitatea din California, Berkeley au scris o lucrare de cercetare disponibilă în preprint pe arXiv, detaliind modul în care au reușit să obțină o rețea neuronală pentru a genera imagini stradale realiste și portrete umane. Au inclus chiar și o interfață de utilizator care vă permite să optimizați imaginile oricum doriți, adăugând frunze suplimentare sau chiar schimbând vremea.

"Jocurile cresc rapid, pentru că oamenii iubesc să interacționeze în medii virtuale", spune Ming-Yu Liu, un om de știință de la Nvidia Invers într-un e-mail. "Cu toate acestea, construirea de lumi virtuale este costisitoare datorită tehnologiei actuale, deoarece necesită artiștii să modeleze și să simuleze în mod explicit textură și iluminare pentru lumea pe care o construiesc. Cu traducerea imaginilor la imagine, putem încerca în schimb lumea reală să creeze lumi virtuale."

Rețelele neuronale sunt computere modelate să funcționeze ca un creier uman, prin preluarea informațiilor, aplicarea acestora și învățarea de la rezultate. Această cercetare a utilizat tipuri speciale de plase neuronale introduse de Ian Goodfellow în 2014, numite rețele generice de adversarială - sau GAN - care constau în general din două rețele, generatorul și discriminatorul.

Generatorul primește fotografii și începe să creeze imagini sintetice asemănătoare celor pe care le-a dat. Apoi arată o combinație între imaginile pe care le-a dat și falsurile către discriminator, a căror sarcină este de a le despărți. Pe măsură ce acest proces merge mai departe, generatorul devine mai bun la imitarea imaginilor originale, iar diferențiatorul devine mai bun în a spune falsurile în afară. Rezultatele sunt câteva imagini destul de convingătoare - și total false -.

Această cercetare se bazează pe modelul GAN ​​tradițional, adăugând divizarea generatoarelor și a rețelelor discriminatorii în câteva sub-rețele, permițând obținerea de imagini cu rezoluție mai mare. Rețelele neuronale sunt, de asemenea, capabile să preia o hartă semantică - sau un model al modului în care fotografia ar trebui să arate - și să umple texturile în mod autonom. Utilizatorii pot chiar să intre în plan și să schimbe lucrurile dacă doresc să adauge clădiri în locul copacilor într-o vedere spre stradă sau să facă ochii mai largi într-un portret.

Hârtia compară rezultatele sale cu experimente similare realizate folosind această metodă, cea mai notabilă fiind pix2pix. Cercetările Nvidia și UC Berkeley pot genera imagini cu detalii minuțioase și precise ca plăcuțele de înmatriculare lizibile, în timp ce pix2pix afișează imagini care aproape arată ca niște picturi cu acuarelă.

În timp ce acest instrument ar putea fi folosit pentru a câștiga niște karma reddit liberă cu câteva fotografii extraordinare, autorii văd un potențial imens în utilizarea acestei abordări pentru a genera o grafică realistă doar cu un simplu model.

Sute de ore de muncă dureroasă merg în generarea de lumi virtuale pentru utilizarea în Google Maps, filme și jocuri video. Liu spune ca acest model ar putea servi ca o modalitate de a obtine cea mai mare parte a proiectarii facute si apoi sa intri si sa tweak detaliile mai tarziu.

"În loc de a reda lumea prin modelarea explicită a acesteia, putem construi lumea implicit prin folosirea traducerii imaginilor la imagine pentru a traduce între un model simplu al lumii care nu conține nici o textura sau iluminare și o ieșire foto-realistă. Această capacitate ar trebui să facă mult mai ieftin să construim lumi virtuale ", spune el Invers.

Pentru următorul pas în această cercetare, echipa speră să exploreze traducerea video-video, care ar folosi plase neuronale pentru a crea videoclipuri realiste. Un obiectiv pe care Lui spune că la provocat pe cercetători în domeniu.

Acum știi cât de ușor pot fi create imagini false. Nu aveți încredere în tot ceea ce vedeți în imaginile Google.

$config[ads_kvadrat] not found