Image
2.10.2017 0 Comments

Startup prináša triky, pomocou ktorých roboty ľahšie zvládnu zložité úlohy

Laboratórium DeepMind patriace Googlu používa sofistikované počítačové simulácie, aby sa počítače naučili, ako plniť určité úlohy. Simulovaný tréning, nazývaný reinforcement learning, vyžaduje od počítača, aby vyskúšal tisíce (alebo aj milióny) rôznych vecí, kým sa mu podarí zistiť, ako to robiť. S využitím tohto prístupu v kombinácii s hlbokým učením londýnska výskumná jednotka učí počítače, ako poraziť najlepších svetových hráčov go, a trénuje roboty pohybovať sa po svete.

Teraz malý kalifornský startup Bonsai objavil trik, ako prekonať DeepMind v tejto hre. Spoločnosť ho nazvala concept networks (koncepčné siete) a podstatne zvyšuje efektívnosť reinforcement learningu.

V nedávno publikovanom článku výskumníci z Bonsai opisujú, ako fungujú koncepčné siete tým, že sa cieľ  rozdelí do rôznych problémových oblastí. Ak chcete napríklad, aby sa robot naučil stavať z kociek, treba úlohu rozdeliť na päť konceptov: dosah, usmernenie, uchopenie, pohyb a skladanie. Robot sa musí naučiť všetkých päť úkonov, aby dokázal vykonať úlohu. Bonsai chce riešiť každý koncept individuálne a nakoniec ich skombinuje na dokončenie úlohy.

Rozbitím problému na jednotlivé koncepty musí robotické rameno riešiť súbor jednoduchších cieľov, napríklad zistiť, ako uchopiť kocku. Niektoré koncepty, ako je dosah a pohyb, sú už vysoko optimalizované pomocou klasických ovládačov (nie hlbokých neurónových sietí), vyjadril sa zakladateľ Bonsai Mark Hammond. To znamená, že dosah a pohyb netreba opakovane trénovať, čím sa skráti čas potrebný na výcvik. Ostatné úkony, ktoré ešte nie sú optimalizované, musí robot trénovať pomocou simulácie prostredníctvom neurónových sietí.

Hoci v dokumente DeepMind sa opisuje podobný prístup k učeniu pri uchopení a stohovaní kociek, koncepčné siete Bonsai sú oveľa efektívnejšie. Systém DeepMind potreboval na naučenie úchopu a stohovania milión pokusov (čo znamená, že robotické rameno malo milión pokusov na dokončenie úlohy v simulovanom prostredí), systému Bonsai na to stačilo 22 000 opakovaní cyklu.

Deep reinforcement learning je dôležitá metóda, ako učiť systémy s umelou inteligenciu interakcii so svetom. Napríklad Google využíva technológiu DeepMind vo svojich dátových centrách, aby znížil spotrebu energie na ich chladenie o 40 %. Bonsai sa zameriava na veľké priemyselné systémy, napr. veterné elektrárne, kde by sa táto technológia mohla využiť na významné zvýšenie efektivity.

Zdroj: Forbes

Autor: Redakcia

Nechajte si posielať prehľad najdôležitejších správ emailom

q

Žiadne komentáre

Vyhľadávanie

e-learnmedia_2018

Najnovšie videá



PC forum button