CNIL
AI & ML interests
Data Protection (GDPR)
Recent Activity
Cette page est le dépôt officiel de la Commission Nationale Informatique et Libertés (CNIL) sur la plateforme HuggingFace. Il s’inscrit dans la mission d’information de la CNIL telle que définie dans l’article 8.I.1 de la loi Informatique et Libertés mais également dans la mission de suivi de l’évolution des technologies de l’information telle que définie dans l’article 8.I.4.
Outil d'exploration de la généalogie des modèles open source
VERSION BĂŠTA
Comment assurer la traçabilité des opérations de modifications effectuées sur un modèle open source ?
Ce projet exploratoire est proposé par le Service IA et le Laboratoire d'Innovation Numérique de la CNIL (LINC). Il a pour but de développer un outil de médiation et de transparence. Il s’agit aujourd’hui d’une version bêta. Cet outil s’adresse aussi bien au grand public désireux de mieux comprendre l’écosystème de l'IA en source ouverte (open source) mais également aux professionnels et académiques.
Objectif de l'outil
Afin d’étudier le développement de la communauté de l’IA open source, et de préparer la possibilité d’exercices de droits par les personnes concernées, le projet vise à étudier la base de données des jeux de données et modèles présents sur la plateforme HuggingFace. Cette base de données très riche permet d’établir un arbre généalogique des modèles. Le contexte précis du projet est présenté dans un article sur le site du LINC insérer lien. À partir de l'identifiant d'un modèle ou d'un jeu de données (dataset), l'outil permet d'explorer les modèles et/ou jeux de données (datasets) dont il provient ou qu'il a engendré (sa généalogie), et en particulier de :
- Générer des statistiques sur la généalogie
- Visualiser et naviguer dans la généalogie sous forme de graphe
- Explorer la généalogie sous forme de tableau interactif
Exemple de statistiques sur une généalogie de modèle
Mentions d'information sur les traitements de données à caractère personnel
Afin d’étudier le développement de la communauté de l’IA open source, et de préparer la possibilité d’exercices de droits des citoyens, le projet vise à étudier la base de données des jeux de données et modèles présents sur la plateforme HuggingFace. Cette base de données permet d’établir un arbre généalogique des modèles. Les données traitées sont le pseudonyme de l’auteur (quand il apparaît dans les métadonnées), le nom du modèle/jeu de données et plusieurs informations inhérentes à ce modèle/jeu de données telles que la date de publication, la licence utilisée ou encore le nombre de téléchargements.
Ce projet relève de la mission d’intérêt public dont est investie la CNIL en application du règlement général sur la protection des données et de la loi Informatique et Libertés modifiée (article 8).
Les données sont publiées à partir de l’espace CNIL sur HuggingFace.
Une première phase d’évaluation de l’utilité de l’outil interviendra après 6 mois de publication. A cette échéance, l’outil pourra être modifié et le projet reconduit. Vous pouvez accéder et obtenir une copie de vos données, vous opposer au traitement de ces données, les faire rectifier ou effacer. Vous disposez également du droit de limiter le traitement de vos données. Vous pouvez exercer vos droits ou poser vos questions sur ce projet en contactant le service IA de la CNIL : [email protected].
Si vous estimez, après nous avoir contactés, que vos droits « Informatique et Libertés » ne sont pas respectés, vous pouvez contacter le DPO de la CNIL ou adresser une réclamation à la CNIL.
