Cybersécurité et IA : GPT-5.5 surclasse déjà Mythos et change l'équilibre

GPT-5.5 s’impose comme une nouvelle référence en cybersécurité offensive. D’après les résultats dévoilés par l’Institut britannique de sécurité de l’IA (AISI), le modèle surpasse Mythos Preview lors d’un test de type Capture The Flag (CTF), largement utilisé pour évaluer les compétences en sécurité informatique.

Ce benchmark, considéré comme l’un des plus représentatifs du secteur, reposait sur 95 défis répartis en plusieurs niveaux de difficulté. L’objectif est de mesurer la capacité des modèles à identifier, exploiter et enchaîner des vulnérabilités dans des environnements simulés.

Face à une dizaine d’IA concurrentes, GPT-5.5 arrive en tête sur les épreuves avancées, avec un taux de réussite de 71,4 %, devant Mythos Preview (68,6 %) et GPT-5.4 (52,4 %). Un écart significatif sur des tâches complexes, là où les modèles les plus récents se montrent globalement équivalents sur les niveaux basiques.

Des capacités techniques poussées à l’extrême

Les épreuves avancées du test mettent en lumière l’étendue des compétences mobilisées. Les modèles devaient notamment :

analyser des micrologiciels sans code source, exploiter des failles mémoire comme les erreurs UAF, contourner des mécanismes cryptographiques, attaquer des générateurs de nombres aléatoires défaillants, ou encore démonter des logiciels malveillants obfusqués.

Autant de scénarios proches de situations réelles, conçus pour tester non seulement la détection de vulnérabilités, mais aussi leur exploitation dans des environnements complexes.

Ces résultats confirment une tendance de fond : les progrès des modèles ne reposent plus uniquement sur leurs connaissances, mais sur leur capacité à raisonner, planifier et exécuter des chaînes d’attaque complètes.

Mythos reste en tête sur les scénarios longs

Malgré cette avance sur les tests CTF, GPT-5.5 n’écrase pas la concurrence sur tous les terrains. Dans les simulations de cyberattaques multi-étapes, Mythos Preview conserve un avantage.

Lors d’un exercice baptisé « The Last Ones », reproduisant une intrusion en 32 étapes, Mythos réussit plusieurs exécutions complètes, là où GPT-5.5 peine davantage. Ce type de scénario, qui exige une planification longue et cohérente, reste un point de différenciation.

Autre test, encore plus critique : une simulation d’attaque de système industriel. Dans ce cas précis, aucune des deux IA n’a réussi à mener l’opération à son terme, illustrant les limites actuelles face à des environnements complexes mêlant informatique et systèmes physiques.

Une montée en puissance qui inquiète les experts

Pour l’AISI, ces résultats ne relèvent pas d’une simple compétition entre modèles. Ils traduisent une accélération globale des capacités cybernétiques des intelligences artificielles.

L’organisme souligne que ces progrès sont liés à des améliorations structurelles : autonomie accrue, raisonnement plus avancé et meilleures compétences en programmation. Autant de facteurs qui pourraient, à court terme, rendre ces systèmes nettement plus performants… et potentiellement plus dangereux.

Dans ce contexte, GPT-5.5 n’est pas accessible au grand public sous sa forme complète. Des restrictions d’usage et des mécanismes de contrôle ont été mis en place afin de limiter les risques.

Vers une nouvelle ère de la cybersécurité

L’émergence simultanée de modèles comme GPT-5.5 et Mythos marque un tournant. Pour les experts, il ne s’agit plus de savoir si ces IA atteindront un niveau critique, mais quand.

Le constat est partagé par les acteurs du secteur : d’autres systèmes aux capacités comparables — voire supérieures — devraient apparaître rapidement. Une perspective qui oblige déjà entreprises et institutions à repenser leurs stratégies de défense face à des adversaires désormais automatisés, rapides et hautement adaptatifs.

Source:

www.zdnet.fr

Cybersécurité et IA : GPT-5.5 surclasse déjà Mythos et change l'équilibre

Des capacités techniques poussées à l’extrême

Mythos reste en tête sur les scénarios longs

Une montée en puissance qui inquiète les experts

Vers une nouvelle ère de la cybersécurité

Ces petits porteurs de caisses régionales du Crédit agricole qui s’estiment maltraités

Le pape Léon XIV célébrera une messe à la Sagrada Familia de Barcelone le 10 juin, pour le centenaire d’Antoni Gaudi

Dysfonctionnements à l’hôpital pédopsychiatrique Fondation Vallée : l’agence régionale de santé confirme le recours à des pratiques d’isolement

« Avec l’augmentation de la population carcérale, nous enfermons de plus en plus et de moins en moins bien »

USA : Exercice militaire XXL pour se préparer au choc Taiwan ?

Anna Stellinger, directrice des affaires internationales et européennes au MEDEF suédois – 06/05

Prix du carburant : la consommation en forte baisse en avril en France, selon Bercy

Hantavirus : de la souche Andres au taux de létalité, le lexique pour comprendre les mots qui circulent avec ce virus

Catégories