Az MIT új algoritmusa előrejelezheti az emberi interakciókat, mielőtt elkeserülnének

$config[ads_kvadrat] not found

Jazz+Az - Mit tehet a sejt? (a Woody Allen-es változat)

Jazz+Az - Mit tehet a sejt? (a Woody Allen-es változat)
Anonim

Más emberek elolvasásának képtelensége néhány epikus magas öt sikertelen és hiányzott csókhoz vezetett. Még az élettartam után is nehéz megjósolni az emberi kölcsönhatásokat. De a MIT Számítástudományi és Mesterséges Intelligencia Laboratóriumában dolgozó kutatók úgy vélik, hogy segíthetnek: Egy új mélytanulású algoritmussal, amely megjósolhatja, hogy két ember ölel, megcsókol, kezet fog, vagy magas öt, nagy lépést tettek a jövő felé áldottan hiányzik ezek a kínos pillanatok.

Reméljük, hogy az új algoritmusuk 600 órányi YouTube-videókkal és TV-műsorokkal rendelkezik Az iroda, Scrubs, Ősrobbanás elmélet, és Született feleségek - lehet használni a kevésbé szociálisan kényelmetlen robotok programozására és a Google Glass-stílusú fejhallgatók kifejlesztésére, hogy javaslatokat tegyen számunkra, mielőtt még megvan az esélyünk arra, hogy hiányozzunk. A jövőben elképzelni fogják, hogy soha többé nem fogsz elrontani egy esélyt arra, hogy a munkatársaiddal levegőn legyél.

Az algoritmus sikerének kulcsa, hogy felismertük, hogy a robotok ugyanolyan módon tanulnak, hogy ugyanolyan módon tanuljanak, ahogyan mi is. „Az emberek automatikusan megtanulják, hogy a tapasztalatok révén előre látják a cselekvéseket, ami arra késztetett bennünket, hogy megpróbáljuk megpróbálni a számítógépeket ugyanazzal a józan észrel elkábítani” - mondja CSAIL Ph.D. Carl Vondrick hallgató, az első szerző a kapcsolódó tanulmányról, amelyet ezen a héten a számítógépes látás és a mintázatfelismerés nemzetközi konferenciáján mutatnak be. „Azt akartuk mutatni, hogy csak a nagy mennyiségű videó megtekintésével a számítógépek elég tudást szerezhetnek ahhoz, hogy következetesen előrejelzéseket tegyenek a környezetükről.”

Vondrick és csapata megtanította az algoritmus több „neurális hálózatát”, hogy ebben az esetben hatalmas mennyiségű adatot elemezzen, Jim és Pam magas öt óra, Mike és Susan titkos csókjait önmagában. Figyelembe véve az olyan tényezőket, mint a kinyújtott karok, a felemelt kéz vagy a hosszabb tekintet, mindegyik neurális hálózat kitalálta, hogy mi fog történni a következő másodpercben, és a hálózatok általános konszenzusát a végső „előrejelzésnek” tekintették a tanulmány.

Az algoritmus az idő 43% -ának megfelelő lett. Bár ez nem tűnik elég magasnak ahhoz, hogy garantáljuk, hogy a mindennapi kölcsönhatásunk kevésbé furcsa lesz, nagy előrelépés a meglévő algoritmusokban, amelyek pontossága mindössze 36 százalék.

Emellett az emberek csak az idő 71 százalékát tudják előre jelezni. Minden segítségre van szükségünk.

A tanulmány második részében az algoritmust arra tanították, hogy megjósolja, hogy az objektum - mint a távvezérlők, az edények és a szemétdobozok - öt másodperccel később jelenjenek meg a jelenetben. Például, ha egy mikrohullámú ajtót nyitnak, viszonylag nagy esély van egy bögre megjelenítésére.

Az algoritmusuk még nem elég pontos a Google Glasshez, de Antonio Torralba társszerzővel, Ph.D. - egy Google karon végzett kutatási díj és Vondrick egy Google Ph.D. közösség - fogadhatunk, hogy odaér. Az algoritmus jövőbeli változatai, Vondrick előrejelzi, a robotok programozására használhatják az emberekkel való interakciót, vagy akár biztonsági kamerákat is taníthatnak, amikor regisztrálnak, amikor egy személy esik vagy megsérül.

„A videó nem olyan, mint egy„ Válasszon saját kalandot ”könyvet, ahol láthatja az összes lehetséges utat” - mondja Vondrick. „A jövő lényegében kétértelmű, ezért izgalmas kihívást jelenteni egy olyan rendszer kidolgozására, amely ezeket az ábrázolásokat felhasználja az összes lehetőség előrejelzésére.”

$config[ads_kvadrat] not found