Jak AI vylepšuje simulace pomocí chytřejších technik vzorkování | Zprávy MIT
Představte si, že máte za úkol poslat tým fotbalistů na hřiště, aby zhodnotili stav trávy (pravděpodobný úkol pro ně, samozřejmě). Pokud jejich pozice vyberete náhodně, mohou se v některých oblastech shlukovat, zatímco jiné zcela zanedbávají. Ale pokud jim dáte strategii, jako je rovnoměrné rozložení po hřišti, můžete získat mnohem přesnější obrázek o stavu trávy.
Nyní si představte, že se potřebujete rozložit nejen ve dvou rozměrech, ale v desítkách nebo dokonce stovkách. To je výzva, kterou mají výzkumníci z MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) před sebou. Vyvinuli přístup řízený umělou inteligencí k „samplování s nízkou diskrepancí“, metodu, která zlepšuje přesnost simulace distribucí datových bodů rovnoměrněji v prostoru.
Klíčová novinka spočívá v použití grafových neuronových sítí (GNN), které umožňují bodům „komunikovat“ a samočinně se optimalizovat pro lepší uniformitu. Jejich přístup představuje klíčové vylepšení pro simulace v oblastech, jako je robotika, finance a výpočetní věda, zejména při řešení složitých, vícerozměrných problémů, které jsou důležité pro přesné simulace a numerické výpočty.
„V mnoha problémech platí, že čím rovnoměrněji můžete rozmístit body, tím přesněji můžete simulovat složité systémy,“ říká T. Konstantin Rusch, hlavní autor nového článku a postdoktorand MIT CSAIL. „Vyvinuli jsme metodu nazvanou Message-Passing Monte Carlo (MPMC) pro generování rovnoměrně rozmístěných bodů pomocí geometrických technik hlubokého učení. To nám dále umožňuje generovat body, které zdůrazňují rozměry, které jsou zvláště důležité pro daný problém, což je vlastnost, která je velmi důležitá v mnoha aplikacích. Základní grafové neuronové sítě modelu umožňují mezi body „mluvit“ a dosáhnout tak mnohem lepší jednotnosti než předchozí metody.“
Jejich práce byla zveřejněno v zářijovém čísle časopisu Proceedings of the National Academy of Sciences.
Vezmi mě do Monte Carla
Myšlenkou metod Monte Carlo je dozvědět se o systému jeho simulací náhodným vzorkováním. Vzorkování je výběr podmnožiny populace k odhadu charakteristik celé populace. Historicky se používal již v 18. století, kdy jej matematik Pierre-Simon Laplace použil k odhadu počtu obyvatel Francie, aniž by musel počítat každého jednotlivce.
Sekvence s nízkou diskrepancí, což jsou sekvence s nízkou diskrepancí, tj. vysokou uniformitou, jako jsou Sobol’, Halton a Niederreiter, jsou již dlouho zlatým standardem pro kvazináhodné vzorkování, které zaměňuje náhodné vzorkování za vzorkování s nízkou diskrepancí. Jsou široce používány v oblastech, jako je počítačová grafika a výpočetní finance, pro vše od cenových možností po hodnocení rizik, kde jednotné vyplnění mezer body může vést k přesnějším výsledkům.
Rámec MPMC navržený týmem transformuje náhodné vzorky na body s vysokou uniformitou. To se provádí zpracováním náhodných vzorků pomocí GNN, které minimalizuje specifickou míru nesrovnalostí.
Jedním z velkých problémů při použití umělé inteligence pro generování vysoce jednotných bodů je to, že obvyklý způsob měření uniformity bodů je velmi pomalý a obtížně se s ním pracuje. Aby to tým vyřešil, přešel na rychlejší a flexibilnější opatření jednotnosti nazvané L2-discrepance. Pro vysokorozměrné problémy, kde tato metoda sama o sobě nestačí, používají novou techniku, která se zaměřuje na důležité nízkorozměrné projekce bodů. Tímto způsobem mohou vytvářet sady bodů, které se lépe hodí pro konkrétní aplikace.
Důsledky sahají daleko za akademickou sféru, říká tým. Například v oblasti výpočetního financování simulace silně spoléhají na kvalitu vzorkovacích míst. „U těchto typů metod jsou náhodné body často neefektivní, ale naše body s nízkou nesrovnalostí generované GNN vedou k vyšší přesnosti,“ říká Rusch. “Například jsme zvažovali klasický problém z výpočetního financování ve 32 dimenzích, kde naše body MPMC překonaly předchozí nejmodernější metody kvazináhodného vzorkování čtyřnásobně až 24krát.”
Roboti v Monte Carlu
V robotice plánování cest a pohybu často spoléhá na algoritmy založené na vzorkování, které provádějí roboty rozhodovacími procesy v reálném čase. Zlepšená jednotnost MPMC by mohla vést k efektivnější robotické navigaci a úpravám v reálném čase pro věci, jako je autonomní řízení nebo technologie dronů. „Ve skutečnosti jsme v nedávném předtisku prokázali, že naše body MPMC dosahují čtyřnásobného zlepšení oproti předchozím metodám s nízkými nesrovnalostmi při aplikaci na skutečné problémy s plánováním pohybu robotiky,“ říká Rusch.
„Tradiční sekvence s nízkou diskrepancí byly ve své době velkým pokrokem, ale svět se stal složitějším a problémy, které nyní řešíme, často existují v 10, 20 nebo dokonce 100-rozměrných prostorech,“ říká Daniela Rus, CSAIL. ředitel a profesor elektrotechniky a informatiky na MIT. „Potřebovali jsme něco chytřejšího, něco, co se přizpůsobí růstu rozměrů. GNN jsou změnou paradigmatu v tom, jak generujeme množiny bodů s nízkou nesrovnalostí. Na rozdíl od tradičních metod, kde jsou body generovány nezávisle, umožňují GNN body „chatovat“ mezi sebou, takže se síť naučí umisťovat body způsobem, který snižuje shlukování a mezery – běžné problémy u typických přístupů.“
V budoucnu tým plánuje učinit body MPMC ještě dostupnějšími pro každého, přičemž se bude zabývat současným omezením trénování nového GNN pro každý pevný počet bodů a dimenzí.
„Velká část aplikované matematiky používá neustále se měnící veličiny, ale výpočty nám obvykle umožňují používat pouze konečný počet bodů,“ říká Art B. Owen, profesor statistiky na Stanfordské univerzitě, který se na výzkumu nepodílel. „Století staré pole nesrovnalostí využívá abstraktní algebru a teorii čísel k definování efektivních vzorkovacích bodů. Tento článek používá grafové neuronové sítě k nalezení vstupních bodů s nízkou nesrovnalostí ve srovnání se spojitým rozdělením. Tento přístup se již velmi blíží nejznámějším množinám bodů s nízkou nesrovnalostí v malých problémech a ukazuje se jako velký příslib pro 32rozměrný integrál z výpočetních financí. Můžeme očekávat, že to bude první z mnoha snah o použití neuronových metod k nalezení dobrých vstupních bodů pro numerické výpočty.
Rusch a Rus napsali tento článek s výzkumníkem Nathanem Kirkem z University of Waterloo, profesorem umělé inteligence DeepMind Oxfordské univerzity a bývalým členem CSAIL Michaelem Bronsteinem a profesorkou statistiky a pojistně matematiky Christiane Lemieux z University of Waterloo. Jejich výzkum byl částečně podporován programem AI2050 v Schmidt Futures, Boeing, Výzkumné laboratoři letectva Spojených států a akcelerátoru umělé inteligence letectva Spojených států, Švýcarské národní vědecké nadaci, Radě pro přírodní vědy a inženýrství Kanady, a EPSRC Turing AI World-Leading Research Fellowship.