Dlouhodobě pracoval jako prestižní vědec ve Francii, USA a Velké Británii. Své bohaté zkušenosti zúročil i po návratu do vlasti. Na Českém institutu informatiky, robotiky a kybernetiky při ČVUT vede výzkumný tým inteligentního strojového vnímání, tj. oblasti umělé inteligence, která spojuje počítačové vidění, strojové učení a robotiku. Jeho výsledky podpořila Evropská výzkumná rada (ERC) a na projekt v oblasti inteligentních počítačových systémů mu udělila prestižní vědecký grant. Seznamte se – Dr. Josef Šivic.
Jaký byl váš první pocit, když jste se o úspěchu dozvěděl?
Bylo to velké překvapení a radost! Vědecká konkurence je v ERC grantech opravdu vysoká. Konkrétně o ERC Advanced granty se uchází skutečně vynikající výzkumníci z celé Evropy se skvělými výsledky. Způsob, jakým se o výsledku člověk dozví, přitom není úplně přímočarý. Přijde vám trochu neosobní e-mail s výzvou, že se máte podívat do grantového systému ERC. Po přihlášení se dočtete, že letos se přihlásilo hodně projektů, soutěž byla velká apod. To vám moc nadějí nedává. Až v další části následuje gratulace, že váš projekt uspěl.
Co si myslíte, že bylo pro úspěch rozhodující?
Klíčová je originalita a potenciál, že v dané oblasti posunete hranice, dosáhnete průlomu. Problém musíte nejen znát, ale být i schopný jej především dobře definovat a pro jeho řešení nalézt originální a inovativní řešení. Ale ani to nestačí. Projekt by měl mít i jasný pozitivní dopad na společnost nebo daný obor.
Stále nemáme systémy a stroje, které by byly schopné spolehlivě vnímat svůj okolní svět, porozumět mu a interagovat s ním. Třeba řídit auto ve všech podmínkách a situacích, vyložit nádobí z myčky nebo něco uvařit.
Přípravě jsem věnoval mnoho úsilí a času. A nejen já. Víte, problém musíte umět pojmenat srozumitelně, tak aby ho dokázal pochopit i člověk, který není v oboru specialista. Bez podpory nejbližších spolupracovníků, zvláště pak při přípravě na pohovor, a rodiny, která měla se mnou po dobu psaní projektu neuvěřitelnou trpělivost, bych to jen stěží dokázal.
Na co hlavně se chcete zaměřit a jaké konkrétní výsledky ve vašem vítězném projektu FRONTIER očekáváte?
Hned na začátek musím říct, že současné výsledky umělé inteligence díky velkým neuronovým modelům, jako je například GPT-4, Chat-GPT nebo Stable Diffusion, jsou opravdu fenomenální. Dokážou generovat odborně znějící texty, počítačový kód, kreativní obrázky nebo složit advokátní zkoušky lépe než 90 procent uchazečů. To je působivé, že? A téměř každý den médii rezonují další efektní výsledky.
Přesto, a možná o to víc překvapivě, stále nemáme systémy a stroje, které by byly schopné spolehlivě vnímat svůj okolní svět, porozumět mu a interagovat s ním. Třeba řídit auto ve všech podmínkách a situacích, vyložit nádobí z myčky nebo něco uvařit.
Čím to je?
Už v 80. letech se tím v Americe zabýval Hans Peter Moravec, rakousko-kanadský vědec v oboru umělé inteligence a robotiky. Pojmenoval jednu překvapivou skutečnost a od té doby se tomu říká “Moravcův paradox”. Některé úlohy, o kterých si myslíme, že jsou pro většinu lidí velmi obtížné, jako třeba složit advokátní zkoušky, jsou ve skutečnosti pro počítačové systémy jednoduché. Prostě lehce zvládnutelné automatizovanými technikami. Naopak jiné úlohy, které nám přijdou jako triviální a děláme je každý den, jsou pro stroj velmi obtížné. Jsou to hlavně senzomotorické úlohy jako již zmíněné řízení auta nebo vyložení myčky.
Moravec doslova napsal, že „je poměrně snadné přimět počítače, aby na úrovni dospělého člověka zvládly inteligenční testy nebo hraní dámy, ale pokud jde o vnímání a mobilitu, je obtížné nebo nemožné jim dát dovednosti ročního dítěte“. Umělá inteligence se od té doby výrazně posunula, nicméně úlohy vnímání okolního světa a interakce s ním na úrovni lidských schopností jsou stále daleko.
Vždyť už nyní ale třeba automobil řadu věcí umí…
Je to složitější. Už někdy v roce 2015 se říkalo, že během několika let tu budou plně autonomně řízená auta, ale ani o osm let později tu plně autonomní systémy, které by fungovaly ve všech situacích, pořád nemáme. Ten problém se ukázal jako mnohem těžší, než jsme čekali.
To se ale nevylučuje s tím, že nám současné systémy nemohou výborně pomoci. Asistivní řízení šetří obrovské množství času a dobře funguje v určitých situacích, jako například při řízení na dálnici nebo popojíždění v koloně. Během jízdy v zácpě cestou do práce si budete moci místo řízení třeba přečíst noviny. To je však ještě na míle daleko k plně autonomnímu řízení, kdy by měl automobil alespoň stejné schopnosti jako člověk ve všech prostředích a podmínkách.
Je poměrně snadné přimět počítače, aby na úrovni dospělého člověka zvládly inteligenční testy nebo hraní dámy, ale pokud jde o vnímání a mobilitu, je obtížné nebo nemožné jim dát dovednosti ročního dítěte.
Hans Peter Moravec
To samé platí i u robotů, které se běžně používají ve výrobě v továrnách. Jsou předprogramované na jednu konkrétní úlohu. Když takového robota dáte do jiného prostředí, tak nebude dělat vůbec nic.
A to chcete řešit v rámci svého projektu?
Ano, chceme vyvinout novou generaci velkých neuronových modelů, v angličtině je nazýváme „foundational”, česky jim můžeme říkat například ”primární modely”, pro systémy s fyzickým tělem, které by, na rozdíl od těch současných, uměly fungovat v dynamickém světě, vnímat ho a interagovat s okolním prostředím. Příkladem může být robot jako domácí asistent, robot v továrně, samoříditelné auto, ale i robot chirurg.
Jak konkrétně toho chcete dosáhnout?
Budeme vyvíjet nové neurální architektury, které budou věrohodně reprezentovat fyzikální a geometrickou strukturu okolního světa. Výsledkem budou nové algoritmy, které umožní učení složitých vícekrokových úkolů. Tedy podobně, jako se umí učit člověk.
Dále chceme vyvinout algoritmy, které by umožňovaly strojům navzájem sdílet nabyté zkušenosti, a tím se lépe a rychleji naučí reagovat s okolním světem. To je ale velmi těžké, protože jednotlivé stroje budou řešit různé úkoly v rozdílných prostředích, a s jedním robotem ve své továrně jen těžko získáte potřebné množství dat. Proto se zaměříme na metody, které nedostatek učících dat nahradí, protože budou umět agregovat zkušenosti z interakcí s prostředím z různých systémů a zobecňovat je.
Kde dále bude možné tyto modely využít?
Potenciál neurálních primárních modelů je velký a některé techniky bude možné v navazujících projektech přenést i do mikrosvěta – například do oblasti molekulární biologie, kde výsledné modely také musí respektovat fyzikální, chemické a biologické zákony. To mě také hodně zajímá a jsem rád, že v této oblasti spolupracujeme s týmy Jiřího Damborského z Masarykovy univerzity a Tomáše Pluskala z ÚOCHB. Chceme, například, tyto techniky zobecnit pro modelování dynamiky a funkce proteinů, což může mít dopad na vývoj léků. Zabýváme se například proteiny souvisejícími s Alzheimerovou chorobu.
Co byste po vaší čerstvé zkušenosti doporučil českým vědcům, aby byla česká stopa v ERC výraznější?
Důvodů, proč máme nízké procento českých projektů, bude určitě víc. Například někdo říká, že čeští vědci neumějí svůj výzkum dobře prezentovat. Osobně si ale myslím, že zvláště v oblasti počítačových věd se ukazuje, jak důležitá je dlouhodobá podpora výzkumu. Dost často jsou vědci při zajištění zdrojů pro svoji práci nuceni věnovat se krátkodobějším a více aplikovaným projektům. Aplikace jsou určitě důležité. Pro mě například jsou výborným zdrojem zajímavých problémů. Na druhou stranu pro ERC musí vědec vykázat silný publikační, tzv. výzkumný track record v dané oblasti. Na to ale při řešení velkého množství aplikovaných projektů není čas ani příležitost. Výzkumníci často nemají vhodné prostředí pro řešení dlouhodobých výzkumných problémů, protože se musí honit za krátkodobými aplikovanými projekty, aby se uživili. Dlouhodobá stabilní institucionální podpora by mohla počet projektů podaných v ERC podpořit tím, že umožní vědcům řešit také více dlouhodobé, a tedy i trochu riskantní problémy.
U vás byla situace jiná?
Ano. Onu potřebnou dlouhodobou podporu pro výzkum mi totiž umožnil projekt IMPACT, díky kterému jsem se před šesti lety vrátil z Francie zpět do Česka na institut CIIRC ČVUT. Získal jsem šestileté financování, ze kterého jsem mohl vybudovat silný tým a věnovat se dané problematice, konkrétně strojovému vnímání, strojovému učení a robotice. Projekt tak v mém případě nahradil chybějící institucionální podporu a byl jedním z klíčových faktorů, proč jsem mohl úspěšný ERC projekt napsat.
Do České republiky a konkrétně na CIIRC ČVUT jste přišel v roce 2017 po mnohaletém působení na francouzském národním výzkumném institutu informatiky, kde jste také realizoval svůj první ERC grant – ERC Starting Grant pro začínající vědce. Před tím jste byl na Univerzitě v Oxfordu a na Massachusetts Institute of Technology v USA. Jak byste zhodnotil, co se od vášeho návratu změnilo v českém vědeckém prostředí v umělé inteligenci? Co funguje dobře a v čem naopak stále zaostáváme za Evropou?
Opravdu velký dopad má podpora výzkumu prostřednictvím velkých projektů. Ukázalo se, že má smysl pomocí dlouhodobých grantů výzkum podporovat. Do České republiky jsem se mohl vrátit nejen já. Na institutu CIIRC máme díky projektové podpoře Roberta Babušku, Josefa Urbana, Tomáše Mikolova, Torstena Sattlera nebo Mikoláše Janotu a další.
Zabýváme se například proteiny souvisejícími s Alzheimerovou chorobu.
Sám ve svém okolí vidím, jak příchod těchto výzkumníků českou vědeckou AI komunitu oživil a posílil. I díky těmto posilám tak má Česká republika pracoviště, která v některých oblastech AI patří mezi vedoucí evropská pracoviště podle počtu publikací na špičkových vědeckých konferencích dané oblasti. Také jsme založili celonárodní platformu AICZECHIA, sdružující vědce v umělé inteligenci, čímž se podařilo českou AI komunitu více propojit. Toto propojování je důležité, protože to vytváří prostor pro synergii mezi jednotlivými obory umělé inteligence. Pokud chceme soutěžit na evropské a světové úrovni, musíme dát dohromady to nejlepší, co v Česku máme.
Co je nutné, aby u nás byly příznivé podmínky pro vývoj v oblasti AI?
Pokud chce být Česká republika v oblasti umělé inteligence skutečným a uznávaným hráčem na mezinárodní úrovni, je důležité s investicemi do výzkumu pokračovat. A to dlouhodobě. Výzkum pohání pokrok a inovace a je základem pro navazující aplikace. Bez silných výzkumných výsledků není nebo v budoucnu nebude co převádět do praxe. Bez silného AI výzkumu hrozí nebezpečí, že Česká republika bude zaostávat v této technologické revoluci za ostatními zeměmi v Evropě a ve světě. Konkurence v tomto oboru je vysoká, o špičkové vědce se jiné státy a univerzity doslova přetahují a dokážou nabídnout dobré podmínky. Byla by velká škoda, aby o takové vědce Česká republika přišla.
Jak vnímáte rozvoj AI v Evropě? Jak si Evropa stojí v oblasti strojového učení v porovnání s lídry, jako je USA a Čína?
Bohužel je třeba přiznat, že Evropa v umělé inteligenci nestačí držet krok se Severní Amerikou a Čínou, které do této oblasti silně investují. Například Kanada investovala do desetiletého ambiciozního výzkumného programu v umělé inteligenci a láká špičkové vědce programem “AI Chairs”. Evropa má svůj koordinovaný plán v umělé inteligenci. Nicméně evropská podpora se zaměřuje na síťovací aktivity a spoléhá na dlouhodobou podporu AI výzkumu jednotlivými členskými státy. Investice do AI výzkumu jsou klíčovým elementem jednotlivých národních strategií (např. ve Francii, Německu a už i například Polsku nebo Bulharsku).
Česká vláda také vypracovala národní AI strategii, ale jasná dlouhodobá podpora AI výzkumu v její implementaci zatím chybí. Český AI výzkum má dobrou výchozí pozici. Je ale potřeba do něj dlouhobě investovat, pokud má být konkureceschopný se zbytkem Evropy a světa, který do AI výzkumu investuje intenzivně. Implementace české národní strategie se bude letos revidovat. Je to skvělá příležitost tento nedostatek napravit. Výzkum je potřeba brát jako investici do budoucna. Ta se vrátí třeba v horizontu pěti či deseti let v podobě inovativních startupů, nových pracovních pozic, inovativních technologií a firem. Jde o dlouhodobou konkureceschopnost naší ekonomiky, průmyslu a společnosti.
Autor: Alena Burešová