Sommaire
Le guide de l’ANSSI
Sur le volet sécurité des AI, l’ANSSI vient de publier son guide, celui-ci concerne la sécurisation d’une architecture de système d’IA générative. Il vise à sensibiliser les administrations et entreprises aux risques liés à l’IA générative ainsi qu’à promouvoir les bonnes pratiques à mettre en œuvre depuis la phase de conception et d’entrainement d’un modèle d’IA jusqu’à la phase de déploiement et d’utilisation en production.
Attention : si d’autres enjeux comme l’éthique, la vie privée, la propriété intellectuelle, la protection du secret des affaires ou encore la protection des données personnelles sont également des enjeux à prendre en compte dans la conception d’un modèle d’IA, ces derniers ne sont pas du domaine d’expertise de l’ANSSI et ne sont donc pas abordés dans ce guide.
Les problématiques de sécurité liées à la qualité des données et à la performance d’un modèle d’IA d’un point de vue métier ne sont pas traitées dans ce document, de même que les enjeux comme l’éthique, la vie privée ou encore la protection des données personnelles.
IA : les 35 recommandations à suivre
Numéro | Description | Page de Référence |
---|---|---|
R1 | Intégrer la sécurité dans toutes les phases du cycle de vie d’un système d’IA | 9 |
R2 | Mener une analyse de risque sur les systèmes d’IA avant la phase d’entraînement | 13 |
R3 | Évaluer le niveau de confiance des bibliothèques et modules externes utilisés dans le système d’IA | 14 |
R4 | Évaluer le niveau de confiance des sources de données externes utilisées dans le système d’IA | 14 |
R5 | Appliquer les principes de DevSecOps sur l’ensemble des phases du projet | 15 |
R6 | Utiliser des formats de modèles d’IA sécurisés | 15 |
R7 | Prendre en compte les enjeux de confidentialité des données dès la conception du système d’IA | 16 |
R8 | Prendre en compte la problématique de besoin d’en connaître dès la conception du système d’IA | 17 |
R9 | Proscrire l’usage automatisé de systèmes d’IA pour des actions critiques sur le SI | 17 |
R10 | Maîtriser et sécuriser les accès à privilèges des développeurs et des administrateurs sur le système d’IA | 18 |
R11 | Héberger le système d’IA dans des environnements de confiance cohérents avec les besoins de sécurité | 18 |
R12 | Cloisonner chaque phase du système d’IA dans un environnement dédié | 19 |
R13 | Implémenter une passerelle Internet sécurisée dans le cas d’un système d’IA exposé sur Internet | 19 |
R14 | Privilégier un hébergement SecNumCloud dans le cas d’un déploiement d’un système d’IA dans un Cloud public | 20 |
R15 | Prévoir un mode dégradé des services métier sans système d’IA | 20 |
R16 | Dédier les composants GPU au système d’IA | 20 |
R17 | Prendre en compte les attaques par canaux auxiliaires sur le système d’IA | 20 |
R18 | Entraîner un modèle d’IA uniquement avec des données légitimement accessibles par les utilisateurs | 21 |
R19 | Protéger en intégrité les données d’entraînement du modèle d’IA | 21 |
R20 | Protéger en intégrité les fichiers du système d’IA | 21 |
R21 | Proscrire le ré-entraînement du modèle d’IA en production | 22 |
R22 | Sécuriser la chaîne de déploiement en production des systèmes d’IA | 22 |
R23 | Prévoir des audits de sécurité des systèmes d’IA avant déploiement en production | 23 |
R24 | Prévoir des tests fonctionnels métier des systèmes d’IA avant déploiement en production | 23 |
R25 | Protéger le système d’IA en filtrant les entrées et les sorties des utilisateurs | 24 |
R26 | Maîtriser et sécuriser les interactions du système d’IA avec d’autres applications métier | 25 |
R27 | Limiter les actions automatiques depuis un système d’IA traitant des entrées non-maîtrisées | 25 |
R28 | Cloisonner le système d’IA dans un ou plusieurs environnements techniques dédiés | 25 |
R29 | Journaliser l’ensemble des traitements réalisés au sein du système d’IA | 25 |
R30 | Contrôler systématiquement le code source généré par IA | 26 |
R31 | Limiter la génération de code source par IA pour des modules critiques d’applications | 27 |
R32 | Sensibiliser les développeurs sur les risques liés au code source généré par IA | 27 |
R33 | Durcir les mesures de sécurité pour des services d’IA grand public exposés sur Internet | 28 |
R34 | Proscrire l’utilisation d’outils d’IA générative sur Internet pour un usage professionnel impliquant des données sensibles | 28 |
R35 | Effectuer une revue régulière de la configuration des droits des outils d’IA générative sur les applications métier | 29 |
Définitions de l’IA
IA générative
L’IA générative est un sous-ensemble de l’intelligence artificielle, axé sur la création de modèles qui sont entraînés à générer du contenu (texte, images, vidéos, etc.) à partir d’un corpus spécifique de données d’entraînement.
Large Language Model
Catégorie de modèles d’IA générative qui peuvent générer du texte proche du lan- gage naturel d’un être humain, et qui sont généralement entraînés sur un large en- semble de données.
Modèle d’IA
Un modèle d’IA désigne, dans le contexte de ce guide, un réseau de neurones et ses paramètres (poids, biais 1).
Système d’IA
Un système d’IA englobe l’ensemble des composants techniques d’une application reposant sur un modèle d’IA : l’implémentation de ce modèle d’IA, les services fron- taux pour les utilisateurs, les bases de données, la journalisation, etc.
Requête
Une requête (ou prompt) désigne l’instruction sous forme de texte envoyée par l’utilisateur au système d’IA.
Attaque adverse
Une attaque adverse (adversarial attack), parfois aussi appelée « attaque antagoniste » ou « attaque par exemples contradictoires » vise à envoyer à un système d’IA une ou plusieurs requêtes malveillantes dans le but de tromper ou d’altérer son bon fonctionnement.
Dans un réseau de neurones, un poids est un coefficient de puissance de la connexion entre 2 neurones, qui s’ajuste pendant toute la phase d’entraînement.
Un biais est une constante liée à un neurone permettant une « compensation » dans le calcul du résultat.
Synthèse
La mise en œuvre d’un système d’IA générative peut se décomposer en 3 phases cycliques : une première phase d’entraînement du modèle d’IA à partir de données spécifiquement choisies, puis une phase d’intégration et de déploiement, et enfin une phase de production opérationnelle dans laquelle les utilisateurs peuvent accéder au modèle d’IA entraîné, par l’intermédiaire du système d’IA.
Ces 3 phases doivent chacune faire l’objet de mesures de sécurisation spécifiques, qui dépendent en partie du choix de sous-traitance retenu pour chaque composante (hébergement, entraînement du modèle, tests de performance, etc.) ainsi que de la sensibilité des données utilisées à chaque étape et de la criticité du système d’IA dans sa finalité.
En complément des menaces classiques inhérentes à tout système d’information, un système d’IA générative peut-être soumis à des attaques spécifiques visant par exemple à perturber le bon fonctionnement de celui-ci (attaques adverses) ou bien à exfiltrer des données traitées par celui-ci.
La question de la protection des données, notamment des données d’entraînement, est donc un enjeu essentiel d’un système d’IA générative, avec comme corollaire la problématique du besoin d’en connaître des utilisateurs lorsqu’ils interrogent le modèle.
En effet, ce dernier est conçu pour générer une réponse à partir de l’ensemble des données auxquelles il a eu accès lors de l’entraînement, ainsi que des données additionnelles qui peuvent être issues de sources internes sensibles.
L’utilisation d’un système d’IA générative doit donc répondre à des besoins de confidentialité (il faut à ce titre rappeler que l’envoi de données sensibles à des outils grand public sur Internet 5 est à proscrire) mais également des besoins en intégrité et en disponibilité.
Les interactions du système d’IA avec d’autres applications ou composants du SI doivent ainsi être sécurisées, limitées au strict besoin opérationnel, et doivent pouvoir être contrôlées par un humain lorsque celles-ci sont critiques pour l’organisation.
Certains usages spécifiques, comme l’assistance par IA pour le développement d’applications, sou- lèvent des problématiques importantes et doivent donc être cadrés (en ayant une grande vigilance sur des modules ou des applications sensibles), contrôlés par des humains et testés régulièrement (avec des outils automatiques d’analyse de code source).
Enfin, la protection des modèles d’IA peut constituer un enjeu au même titre que la protection des données, non seulement pour des raisons de protection du potentiel scientifique et technique de la nation (recherche académique, modèles utilisés pour la sécurité nationale, etc.), mais aussi parce qu’un attaquant ayant connaissance de l’architecture et des paramètres d’un modèle peut potentiellement améliorer ses capacités d’attaques à d’autres fins (exfiltration de données, etc.).
Scénarios d’attaques sur l’IA générative
Un système d’IA générative est de prime abord une application métier standard, qui doit disposer du même socle de sécurité que toute autre application métier de l’entité.
Toutefois, en complément de ce socle de sécurité, l’entité doit prendre en compte des menaces spécifiques à un système d’IA générative
Ces menaces peuvent être déclinées en 3 grandes catégories d’attaques 8 :
Attaques par manipulation : ces attaques consistent à détourner le comportement du système d’IA en production au moyen de requêtes malveillantes. Elles peuvent provoquer des réponses inattendues, des actions dangereuses ou un déni de service ;
Attaques par infection : ces attaques consistent à contaminer un système d’IA lors de sa phase d’entraînement, en altérant les données d’entraînement ou en insérant une porte dérobée ;
Attaques par exfiltration : ces attaques consistent à dérober des informations sur le système d’IA en production, comme les données ayant servi à entraîner le modèle, les données des uti- lisateurs ou bien des données internes du modèle (paramètres).
Dans le contexte de l’IA générative, ces attaques peuvent porter atteinte aux besoins de sécurité suivants :
Confidentialité : l’objectif est de protéger un système d’IA contre la fuite d’informations consi- dérées comme sensibles : jeux de données d’entraînement, requêtes des utilisateurs, paramètres des modèles, données additionnelles internes, etc. ;
Intégrité : l’objectif est de protéger un système d’IA contre une modification non prévue de son comportement. L’intégrité peut concerner directement le modèle (paramètres) ou bien viser les jeux de données d’entraînement (empoisonnement) ou encore les composants techniques permettant le bon fonctionnement du système d’IA : scripts 9, bibliothèques externes (supply- chain attack), configurations des services, etc. ;
Disponibilité : l’objectif est de protéger un système d’IA contre des dénis de service ou des actions visant à dégrader ses performances (requêtes malveillantes) ;
Traçabilité : l’objectif est de garantir d’une part l’explicabilité et l’imputabilité des actions réalisées sur un système d’IA. Ces éléments peuvent faciliter le travail d’investigation et de remédiation après un incident de sécurité.