Vedle vojáků nasazených do akce současně fungují autonomní robotičtí agenti – to je budoucí operační koncept americké armády, označovaný multidoménové operace (MDO).
Design autonomního chování, kdy je vztah mezi dynamikou a cílem složitý, lze řešit posilováním učení. Tato technika si v poslední době získala pozornost při řešení pro roboty dříve nepředstavitelných úkonů, jako je hraní šachů nebo strategických her typu Starcraft II.
Aktuální praxe bohužel vyžaduje astronomicky složité výpočty v rozsahu tisíce let simulovaní dané hry. Komplikovanost vstupních informací pak činí mnoho běžně aplikovaných mechanismů nepoužitelných pro MDO. Koppel a jeho výzkumný tým proto vyvinuli nová schémata, jejichž složitost výpočtů je jasně stanovena.
„Naše vyhlídky jsou optimistické. Věřím, že autonomní roboti s novým vybavením budou schopni pomoci vojákům při průzkumu a vyhodnocování rizik na bojištích zítřka,“ řekl Koppel. „To, že se tato vize stala realitou, je pro nás stěžejní. Díky tomu víme, kterým výzkumným problémům se v budoucnosti věnovat.“
Jak informuje web TechXplore, dalším krokem v tomto výzkumu bude začlenit širší cíle rozhodování robotů. Podle Koppela dokáže technologie v budoucnu rozhodovat v nejistých situacích i v týmových scénářích.
„Tyto výukové komponenty umožní autonomním agentům uvažovat a přizpůsobovat se měnícím se podmínkám na bojištích. Základní mechanismus přizpůsobení a opětovného plánování se skládá z posílení politik založených na učení. Efektivní implementace těchto politik je zásadní pro to, aby se provozní koncept MDO (Multi-Domain Operations) stal realitou,“ shrnuje vyvíjený koncept armádní výzkumník Dr. Alec Koppel z velení pro rozvoj bojových schopností USA, nyní známého jako DEVCOM.