GPT-5.5 matcher Mythos i cyberangrepstester

Hovedpunkter:

  • GPT-5.5 oppnådde en suksessrate på 71,4 % i ekspert-nivå cyberangrepstester.
  • Modellen fullførte en 32-trinns nettverksangrepssimulering i 2 av 10 forsøk.
  • Dette gjør GPT-5.5 til den andre modellen som har klart denne testen, etter Mythos.
  • Resultatene antyder at avanserte cyberangrepsevner ikke er unike for én modell.
  • AISI understreker behovet for økt oppmerksomhet rundt AI-modellers potensielle risikoer.

Storbritannias AI Security Institute (AISI) har nylig evaluert OpenAIs nyeste modell, GPT-5.5, og funnet at den presterer på samme nivå som Anthropics Mythos i avanserte cyberangrepstester.

I en serie "capture-the-flag" (CTF) tester, som simulerer ulike cyberangrepsscenarier, oppnådde GPT-5.5 en suksessrate på 71,4 % på ekspert-nivå oppgaver. Dette er en forbedring fra tidligere modeller som GPT-5.4, som hadde en suksessrate på 52,4 %.

Videre klarte GPT-5.5 å fullføre AISIs 32-trinns "The Last Ones" nettverksangrepssimulering i 2 av 10 forsøk. Dette gjør den til den andre modellen som har klart denne testen, etter Mythos.

Disse funnene antyder at avanserte cyberangrepsevner ikke er unike for én enkelt modell, men snarere et resultat av generelle forbedringer i AI-modellers autonomi, resonnering og kodingsevner. AISI understreker behovet for økt oppmerksomhet rundt potensielle risikoer knyttet til slike avanserte AI-modeller.

OpenAI har tidligere annonsert GPT-5.5 som en modell med forbedret resonnering, kontekstforståelse og konsistens i komplekse oppgaver. Disse evalueringene bekrefter at modellen lever opp til disse påstandene, spesielt innenfor cyberangrepssimuleringer.