Algoritmus, amely 'Pong' Now kiválóan működik a "Flappy Bird" -nél, még mindig egyedülálló

$config[ads_kvadrat] not found

SKINCONSULT AI-BŐRGYÓGYÁSZOKKAL KIFEJLESZTETT ALGORITMUS, AMELY A BŐRÖREGEDÉS LÁTHATÓ JELEIT ELEMZI

SKINCONSULT AI-BŐRGYÓGYÁSZOKKAL KIFEJLESZTETT ALGORITMUS, AMELY A BŐRÖREGEDÉS LÁTHATÓ JELEIT ELEMZI
Anonim

A mélyreható tanulási módszer fejlesztése Pong, Űrbéli megszállók és más Atari játékok, Stanford Egyetem számítógéptudományi hallgatója, Kevin Chen egy olyan algoritmust hozott létre, amely meglehetősen jó a klasszikus 2014-es oldalsó görgetőben Csapkodó madár. Chen egy „q-learning” néven ismert fogalmat bonyolított le, amelyben az ügynök célja, hogy a játék minden iterációjával javítsa a jutalom pontszámát, hogy tökéletesítsen egy szinte lehetetlen és lehetetlen addiktív játékot.

Chen olyan rendszert hozott létre, amelyben az algoritmusa három jutalmat keresett: egy kis pozitív jutalom minden egyes keret számára, amely életben maradt, nagy jutalom a csövön való áthaladásért, és ugyanolyan nagy (de negatív) jutalom a halálért. A motivált, az úgynevezett „mély-q” hálózat az embereket felülmúlhatja, a Chen által készített jelentés szerint: „Sikeresen játszhattunk a játékban Csapkodó madár egyenesen a pixelektől és a pontszámtól való tanulással, szuper-emberi eredmények elérése érdekében.

Az eredeti Atari papír 2015 - ben megjelent Természet, a Google tulajdonában lévő DeepMind cégtől származik (ma híres az ókori kínai társasjáték Go-ról). A DeepMind teljesítménye áttörést jelentett abban, hogy legalább vizuális - vagy pixel - információt vett, és minimális bemenettel képes volt maximalizálni a jutalmat. Egy ilyen jutalmazási rendszert hasonlítottunk az agy dopaminerg reakciójához, csak egyszerűsítették.

Ez nem az első alkalom, hogy egy algoritmus meghódította a csapkodó madarat: A Stanford Egyetem korábbi számítógéposztálya egy olyan programot hozott létre, amely egy éjszakán át végzett képzés után 0 pontból 1600-ra emelkedett.

$config[ads_kvadrat] not found