AI & ML interests

Data Protection (GDPR)

Recent Activity

nbkcnil  updated a Space 16 days ago
cnil/README
nbkcnil  published a Space about 1 month ago
cnil/README
View all activity

Cette page est le dépôt officiel de la Commission Nationale Informatique et Libertés (CNIL) sur la plateforme HuggingFace. Il s’inscrit dans la mission d’information de la CNIL telle que définie dans l’article 8.I.1 de la loi Informatique et Libertés mais également dans la mission de suivi de l’évolution des technologies de l’information telle que définie dans l’article 8.I.4.

Outil d'exploration de la généalogie des modèles open source

VERSION BĂŠTA

Comment assurer la traçabilité des opérations de modifications effectuées sur un modèle open source ?

Ce projet exploratoire est proposé par le Service IA et le Laboratoire d'Innovation Numérique de la CNIL (LINC). Il a pour but de développer un outil de médiation et de transparence. Il s’agit aujourd’hui d’une version bêta. Cet outil s’adresse aussi bien au grand public désireux de mieux comprendre l’écosystème de l'IA en source ouverte (open source) mais également aux professionnels et académiques.

Objectif de l'outil

Afin d’étudier le développement de la communauté de l’IA open source, et de préparer la possibilité d’exercices de droits par les personnes concernées, le projet vise à étudier la base de données des jeux de données et modèles présents sur la plateforme HuggingFace. Cette base de données très riche permet d’établir un arbre généalogique des modèles. Le contexte précis du projet est présenté dans un article sur le site du LINC insérer lien. À partir de l'identifiant d'un modèle ou d'un jeu de données (dataset), l'outil permet d'explorer les modèles et/ou jeux de données (datasets) dont il provient ou qu'il a engendré (sa généalogie), et en particulier de :

  • GĂ©nĂ©rer des statistiques sur la gĂ©nĂ©alogie
  • Visualiser et naviguer dans la gĂ©nĂ©alogie sous forme de graphe
  • Explorer la gĂ©nĂ©alogie sous forme de tableau interactif

genmod

Exemple de statistiques sur une généalogie de modèle

Mentions d'information sur les traitements de données à caractère personnel

Afin d’étudier le développement de la communauté de l’IA open source, et de préparer la possibilité d’exercices de droits des citoyens, le projet vise à étudier la base de données des jeux de données et modèles présents sur la plateforme HuggingFace. Cette base de données permet d’établir un arbre généalogique des modèles. Les données traitées sont le pseudonyme de l’auteur (quand il apparaît dans les métadonnées), le nom du modèle/jeu de données et plusieurs informations inhérentes à ce modèle/jeu de données telles que la date de publication, la licence utilisée ou encore le nombre de téléchargements.

Ce projet relève de la mission d’intérêt public dont est investie la CNIL en application du règlement général sur la protection des données et de la loi Informatique et Libertés modifiée (article 8).

Les données sont publiées à partir de l’espace CNIL sur HuggingFace.

Une première phase d’évaluation de l’utilitĂ© de l’outil interviendra après 6 mois de publication. A cette Ă©chĂ©ance, l’outil pourra ĂŞtre modifiĂ© et le projet reconduit. Vous pouvez accĂ©der et obtenir une copie de vos donnĂ©es, vous opposer au traitement de ces donnĂ©es, les faire rectifier ou effacer. Vous disposez Ă©galement du droit de limiter le traitement de vos donnĂ©es. Vous pouvez exercer vos droits ou poser vos questions sur ce projet en contactant le service IA de la CNIL : [email protected].

Si vous estimez, après nous avoir contactés, que vos droits « Informatique et Libertés » ne sont pas respectés, vous pouvez contacter le DPO de la CNIL ou adresser une réclamation à la CNIL.

models 0

None public yet

datasets 0

None public yet