AI bots now beat 100% of those traffic-image CAPTCHAs
Každý, kdo nějakou dobu surfuje na webu, je pravděpodobně zvyklý proklikávat se CAPTCHA mřížkou s obrázky ulic a identifikovat každodenní předměty, aby dokázal, že jde o člověka a ne o automatizovaného robota. Nyní však nový výzkum tvrdí, že lokálně spouštění roboti používající speciálně trénované modely rozpoznávání obrázků mohou v tomto stylu CAPTCHA dosahovat 100% úspěšnosti, přestože rozhodně nejsou lidé.
Doktorand ETH Zurich Andreas Plesner a nový výzkum jeho kolegů, k dispozici jako předtiskový papírse zaměřuje na Google ReCAPTCHA v2, který vyzývá uživatele, aby identifikovali, které obrázky ulic v mřížce obsahují položky, jako jsou jízdní kola, přechody pro chodce, hory, schody nebo semafory. Google začal tento systém vyřazovat před lety ve prospěch „neviditelné“ reCAPTCHA v3, která analyzuje interakce uživatelů spíše než nabízet explicitní výzvu.
Navzdory tomu starší reCAPTCHA v2 je stále používají miliony webových stránek. A dokonce i weby, které používají aktualizovanou reCAPTCHA v3, někdy budou použijte reCAPTCHA v2 jako záložní když aktualizovaný systém dává uživateli nízké „lidské“ hodnocení spolehlivosti.
Řekněte YOLO CAPTCHA
K vytvoření robota, který by mohl porazit reCAPTCHA v2, použili vědci vyladěnou verzi open source model rozpoznávání objektů YOLO („You Only Look Once“)kterou si možná dlouholetí čtenáři pamatují byl také použit v cheatových botech videoher. Výzkumníci říkají, že model YOLO je “dobře známý svou schopností detekovat objekty v reálném čase” a “lze jej použít na zařízeních s omezeným výpočetním výkonem, což umožňuje rozsáhlé útoky ze strany uživatelů se zlými úmysly.”
Po trénování modelu na 14 000 označených dopravních obrázcích měli vědci systém, který dokázal identifikovat pravděpodobnost, že jakýkoli poskytnutý obrázek mřížky CAPTCHA patří do jedné ze 13 kandidátských kategorií reCAPTCHA v2. Výzkumníci také použili samostatný, předem trénovaný model YOLO pro výzvy, které nazvali „typ 2“, kde CAPTCHA žádá uživatele, aby identifikovali, které části jednoho segmentovaného obrázku obsahují určitý typ objektu (tento model segmentace fungoval pouze na devíti ze 13 kategorií objektů a jednoduše požádal o nový obrázek, když byl předložen s ostatními čtyřmi kategoriemi).
Kromě modelu rozpoznávání obrazu museli vědci také podniknout další kroky, aby oklamali systém reCAPTCHA. Síť VPN byla například použita k zamezení detekce opakovaných pokusů ze stejné IP adresy, zatímco byl vytvořen speciální model pohybu myši pro přiblížení lidské činnosti. Byly také použity falešné informace o prohlížeči a souborech cookie ze skutečných relací procházení webu, aby se automatizovaný agent jevil lidštější.
V závislosti na typu identifikovaného objektu byl model YOLO schopen přesně identifikovat jednotlivé obrázky CAPTCHA kdekoli od 69 procent času (u motocyklů) do 100 procent času (u požárních hydrantů). Tento výkon – v kombinaci s dalšími opatřeními – byl dostatečně silný na to, aby pokaždé proklouzl sítí CAPTCHA, někdy po několika jednotlivých výzvách předložených systémem. Ve skutečnosti byl bot schopen vyřešit průměrný CAPTCHA v o něco méně problémech než člověk v podobných studiích (ačkoli zlepšení oproti lidem nebylo statisticky významné).
Bitva pokračuje
Zatímco předchozí akademické studie pokoušely se použít modely rozpoznávání obrázků k řešení reCAPTCHA, byly schopny uspět pouze v 68 až 71 procentech případů. Vzestup na 100% úspěšnost “ukazuje, že jsme nyní oficiálně ve věku mimo captchas,” podle autorů nového článku.
Ale to není úplně nový problém ve světě CAPTCHA. Již v roce 2008 výzkumníci ukazovali, jak lze roboty vycvičit prolomit audio CAPTCHA určeno pro zrakově postižené uživatele. A do roku 2017 to byly neuronové sítě používá se k překonání textových CAPTCHA který požadoval, aby uživatelé zadali písmena zobrazená ve zkomolených fontech.
Nyní, když lokálně provozované umělé inteligence mohou také snadno nejlépe vytvářet obrázky CAPTCHA založené na obrázcích, bitva o identifikaci lidí se bude nadále posouvat směrem k jemnějším metodám snímání otisků zařízení. „Velmi se zaměřujeme na to, abychom našim zákazníkům pomohli chránit jejich uživatele, aniž by ukazovali vizuální problémy, a proto jsme v roce 2018 spustili reCAPTCHA v3,“ mluvčí Google Cloud. řekl New Scientist. „Dnes je většina ochran reCAPTCHA napříč 7 [million] stránky po celém světě jsou nyní zcela neviditelné. Neustále vylepšujeme reCAPTCHA.”
Přesto, jak jsou systémy umělé inteligence stále lepší v napodobování více a více úkolů, které byly dříve považovány výhradně za lidské, může být stále těžší a těžší zajistit, aby uživatel na druhém konci tohoto webového prohlížeče byl skutečně osobou.
“V jistém smyslu dobrý captcha označuje přesnou hranici mezi nejinteligentnějším strojem a nejméně inteligentním člověkem,” píší autoři článku. “S tím, jak se modely strojového učení přibližují lidským schopnostem, je hledání dobrých captchas stále obtížnější.”