Diz 77 cz
Efektivní metody pro učení modelů a řízení v robotice
Autor: Erik Derner
Znalost matematických modelů dynamických systémů je klíčová pro celou řadu inženýrských a vědeckých disciplín. Modely umožňují provádění simulací, analýzu chování systému, rozhodování a návrh řídicích algoritmů. Z použití modelů těží i techniky, které z principu fungují bez modelu, například posilované učení. Využití metod pro učení modelů v robotice má však svá specifika. Získat informativní data pro učení dynamických modelů může být obtížné, zvláště během vykonávání dané úlohy. Navzdory rostoucí popularitě mají běžně používané metody učení modelů, jako jsou hluboké neuronové sítě, své nevýhody. Vyžadují velký objem trénovacích dat a značný výpočetní výkon, aby se naučily velký počet parametrů. Jejich black-box charakter neumožňuje interpretaci modelu ani vhled do jeho struktury. Také správné nastavení konfigurace pro dosažení dobrých výsledků je u těchto metod často obtížný úkol.
Cílem této disertační práce je navrhnout řešení aktuálních problémů v oblasti učení modelů z dat v robotice. Práce představuje několik variant a rozšíření symbolické regrese. Tato technika, založená na genetickém programování, je vhodná pro automatické vytváření kompaktních a přesných modelů v podobě analytických rovnic i z malých souborů dat. Jedním z problémů v robotice je velké množství dat, které jsou roboty během provozu shromažďovány, což vyžaduje výběr podmnožiny trénovacích vzorků. Tato práce představuje novou metodu výběru vzorků založenou na predikční chybě modelu a porovnává ji se čtyřmi alternativními metodami. Experimentální vyhodnocení na mobilním robotu ukazuje, že model naučený jen z několika desítek vzorků vybraných navrženou metodou může být využit pro úspěšné vykonání úlohy založené na řízení metodou posilovaného učení.
Běžně používané techniky učení modelů z dat v mnoha případech generují modely, které nevyhovují fyzikálním omezením robota. Částečný teoretický nebo empirický model robota je přitom často znám. Tato práce ukazuje, jak lze symbolickou regresi přirozeně rozšířit tak, aby byly předem známé informace o robotu zahrnuty do procesu učení modelu. Experimentální vyhodnocení na dvou různých robotech ukazuje, že symbolická regrese je schopna automaticky vytvářet modely, které jsou přesné, vyhovují fyzikálním omezením a kompenzují nedostatky teoretického nebo empirického modelu.
Efektivní metody jsou třeba nejen k učení modelů robotů, ale také k učení modelů prostředí robota. Práce je zakončena představením nové metody pro spolehlivou lokalizaci robotů v dynamických prostředích. V navrhovaném přístupu se využívá model prostředí založený na vážených lokálních vizuálních příznacích. Algoritmus detekce změn průběžně aktualizuje tyto váhy během pohybu robota prostředím. Základní myšlenkou metody je na základě těchto vah rozlišit užitečné informace ve stabilních oblastech scény od nespolehlivých informací v oblastech, které se mění. Rozsáhlé experimentální vyhodnocení a srovnání s alternativními metodami ukazuje, že použití navrženého algoritmu detekce změn zlepšuje přesnost lokalizace.