Únik dat: Skupina Anonymous Discord Group si nárokuje přístup k vysoce rizikovému modelu umělé inteligence společnosti Anthropic

8

Anonymní skupina uživatelů na Discordu tvrdí, že se jim podařilo obejít bezpečnostní opatření a získat přístup k Claude Mythos Preview, vysoce citlivému, dosud nevydanému modelu umělé inteligence od Anthropic. Tento incident je obzvláště znepokojivý kvůli specifickým schopnostem, které tento model má.

Sázky jsou vysoké: model vytvořený pro kybernetickou válku

Anthropic klasifikoval Claude Mythos jako nástroj měnící hru s vážnými bezpečnostními důsledky. Podle společnosti je model schopen:
– Identifikujte zero-day zranitelnosti (dříve neznámé zranitelnosti) ve velkých operačních systémech.
– Využijte slabiny ve všech hlavních webových prohlížečích.

Díky těmto schopnostem společnost Anthropic držela model pod přísnou kontrolou v rámci Project Glasswing. Iniciativa pouze pro pozvání byla navržena tak, aby poskytovala přístup vybrané skupině technologických lídrů s uvedeným cílem používat umělou inteligenci k ochraně kritického softwaru na světě. Zprávy o hacku však naznačují, že nástroj určený k přepracování kybernetické bezpečnosti mohl být kompromitován kvůli jednoduchým lidským a procedurálním chybám.

Jak k hacku došlo: dohady a přístup zasvěcených osob

Na rozdíl od toho, co by se dalo očekávat od hacku využívajícího tak výkonnou AI, nebylo narušení výsledkem sofistikovaného technického útoku. Místo toho se to stalo kombinací rozpoznávání vzorů a pomoci zevnitř:

  1. Rozpoznávání vzorů: Pomocí dat z nedávného úniku ze startupu AI Mercor tým přišel na systém pojmenování, který Anthropic používá. To jim umožnilo uhodnout síťové umístění nevydaného modelu.
  2. Insider Access: Jakmile bylo místo určeno, skupina využila privilegovaného přístupu poskytovaného členem, který pracoval pro externího dodavatele, Anthropic.

Skupina působí na soukromém kanálu Discord věnovaném vyhledávání informací o dosud nevydaných modelech umělé inteligence. Zatímco členové říkají, že používají tento nástroj pro neškodné úkoly, jako je vytváření jednoduchých webových stránek, uvedli také, že mají přístup k ještě tajnějším antropickým modelům.

Aktuální situace

Společnost Antropic potvrdila agentuře Bloomberg, že si je těchto obvinění vědoma a v současné době je vyšetřuje. Zatímco skupina poskytla dostatek důkazů na podporu svého přístupu, v současné době nic nenasvědčuje tomu, že by byl systém kompromitován jinými lidmi zvenčí.

Incident zdůrazňuje rostoucí napětí v odvětví umělé inteligence: Jak se modely stávají stále schopnějšími automatizovat kybernetické útoky, bezpečnostní protokoly, které je chrání, musí být exponenciálně robustnější.

Závěr

Zprávy o přístupu k Claude Mythos odhalují kritickou zranitelnost v tom, jak společnosti AI provozují vysoce citlivé a vysoce rizikové modely. Pokud lze k modelu, který by mohl změnit tvář kybernetické bezpečnosti, získat přístup pomocí jednoduchého hádání a prostřednictvím účtů dodavatelů, vyvolává to naléhavé otázky o bezpečnosti příští generace umělé inteligence.