Comment détecter si votre IA a formé un modèle et comment le désactiver

À l’incrédulité de nombreuses personnes, des artistes vivants découvrent que leur art a été utilisé pour former des modèles d’IA sans leur permission. À l’aide d’un outil Web appelé “Suis-je formé ?”, vous pouvez savoir en quelques minutes si vos images ont été transmises à Midjourney, NightCafe et à d’autres générateurs d’images AI populaires.


Si vous trouvez votre image dans l’un des ensembles de données utilisés pour former ces systèmes d’IA, ne désespérez pas. Certaines organisations ont développé des moyens de se retirer de cette pratique, afin que vos images ne soient pas extraites d’Internet et remises à des sociétés d’intelligence artificielle.


Comment les générateurs d’images AI sont formés en premier lieu

Lorsque vous demandez à un système d’IA comme DALL-E de générer une image d’un “chien portant un chapeau d’anniversaire”, il doit d’abord savoir à quoi ressemble un chien et à quoi ressemble un chapeau d’anniversaire. Il obtient ces informations à partir d’énormes ensembles de données qui collectent des milliards de liens vers des images sur Internet.

Comme nous le savons tous, Internet contient à peu près n’importe quel type d’image que vous pouvez imaginer, y compris, selon toute vraisemblance, des tonnes d’images d’un “chien portant un chapeau d’anniversaire”. Avec suffisamment de données comme celle-ci, un modèle d’IA peut déterminer comment reproduire une image à l’image de celle sur laquelle il a été entraîné.

Lire aussi :  Lequel choisir ? Comparez le Samsung Galaxy S23, le S23+ et le S23 Ultra !

Mais que se passerait-il si ces images étaient à l’origine protégées par le droit d’auteur ? Et si ces images appartenaient à des artistes, des photographes ou des gens ordinaires qui ne savaient pas que leurs images alimentaient un système d’IA ?

Le problème des artistes

De nombreux générateurs d’images AI ont un niveau payant où les utilisateurs peuvent acheter des crédits pour créer plus d’images, ce qui leur rapporte un profit. Mais ce profit est réalisé sur le dos de personnes non créditées dont les images ont été utilisées pour former le système d’IA en premier lieu.

Alors que de plus en plus d’artistes découvrent que leurs images ont été utilisées pour développer des systèmes d’IA, il est clair que tout le monde n’est pas d’accord. À tout le moins, ils veulent que les entreprises d’IA obtiennent la permission avant d’utiliser leurs images.

Quatre images d'un chien coiffé d'un chapeau à la manière d'Henri Magritte, générées avec DALL-E

Surtout si vous êtes un artiste populaire et bien connu, les images générées dans votre style peuvent remplir votre marché de fans ou de mécènes potentiels, sans savoir si l’art a été créé par vous ou reproduit à votre image par l’IA. Pire encore, les gens peuvent créer des œuvres d’art dans votre style pour soutenir des valeurs auxquelles vous ne croyez pas.

Ce n’est pas un problème nouveau, les deepfakes existent depuis des années et risquent de s’aggraver avec la montée en puissance de l’IA. De nos jours, reproduire de l’art “faux” est rapide, bon marché et facile. Il n’y a que quelques façons d’identifier une image générée par l’IAce qui rend difficile de repérer l’art original de son homologue généré par l’IA.

Jeux de données : recherchez et indexez vos images

Comme nous l’avons mentionné précédemment, les jeux de données d’images sont utilisés par les sociétés d’IA pour former leurs modèles. Ces ensembles de données ressemblent à une feuille de calcul Excel géante avec une colonne contenant un lien vers une image sur Internet, tandis qu’une autre contient la légende de l’image.

Toutes les entreprises d’IA ne divulgueront pas l’ensemble de données qu’elles utilisent, DALL-E en étant un exemple. Cela rend difficile de savoir à quoi il est fait référence lorsqu’il génère une image et ajoute à la mystique générale des systèmes d’IA.

D’autre part, Stable Diffusion, un modèle développé par Stability AI, a clairement indiqué qu’il est construit sur le Jeu de données LAION-5B, qui contient un colossal 5,85 milliards de paires image-texte filtrées CLIP. Étant donné que cet ensemble de données est open source, n’importe qui est libre de voir les images qu’il indexe, c’est pourquoi il a fait l’objet de vives critiques.

Début 2023, Getty Images a poursuivi Stability AI pour récupérer des images de son site Web afin de former son générateur d’images IA, Stable Diffusion. Si vous vous demandez qui utilise à son tour Stable Diffusion, ce serait NightCafe, Midjourney et DreamStudio, certains des plus grands acteurs du domaine.

Comment savoir si vos images ont été utilisées pour former un modèle d’IA

Préparé par un groupe d’artistes, Veau est un collectif dont le but est d’aider les gens à savoir si leurs images se trouvent sur des ensembles de données comme LAION-5B, qui sont utilisés pour former des modèles d’IA. Leur moteur de recherche Web appelé Suis-je formé ? vous permet de rechercher facilement des mots-clés comme le nom de votre artiste.

Suis-je formé ?

Ai-je été formé page d'accueil

Ai-je été formé fonctionne un peu comme une recherche d’images Google, sauf que votre recherche correspond aux résultats de l’ensemble de données LAION-5B. Vous avez la possibilité de rechercher soit par mot-clé, soit par image, cette dernière étant utile si vous souhaitez voir si une image exacte a été utilisée.

Résultats de recherche pour Frida Kahlo sur Suis-je éduqué?  site Internet

Nous avons utilisé le nom de l’artiste Frida Kahlo (1907-1954) pour le tester et avons trouvé un mélange de photos historiques et de ce qui ressemble à du fan art sous forme de griffonnages, de peintures, de points de croix, de crochet et d’illustrations.

Si vous êtes l’un de ces créateurs, vous faites partie des nombreuses personnes non créditées dont la créativité a permis l’existence de générateurs d’images IA. Et avec ce pouvoir, n’importe qui peut désormais créer des images de Frida comme ce portrait bizarre de “Frida Kahlo mangeant de la glace”.

Une image générée par l'IA de Frida Kahlo réalisée avec Night Cafe

Essayez de saisir votre propre nom d’artiste dans la barre de recherche pour voir si votre travail a été utilisé pour former un modèle d’IA.

Comment extraire des ensembles de données de formation AI

La même équipe derrière le site Web Have I Been Trained a créé un outil permettant aux gens d’adhérer ou de ne pas participer aux systèmes d’art de l’IA. C’est une façon pour les artistes de conserver le contrôle et les autorisations sur qui utilise leur art et dans quel but.

D’autres plates-formes d’art commencent à emboîter le pas et actuellement DeviantArt offre une option pour exclure leurs images de la recherche par des ensembles de données d’images.

Suis-je formé : outil de désactivation de l’IA

En plus de pouvoir rechercher votre image, vous pouvez également sélectionner des images à extraire des données d’entraînement LAION-5B à l’aide du site Web Have I Been Trained.

Vous devrez d’abord créer un compte, puis faire un clic droit sur une image et choisir de Extraire cette image.

Option de menu pour extraire et imager en utilisant le site Suis-je formé ?

Si vous sélectionnez cette option, cette image sera ajoutée à votre liste de retrait à laquelle vous pouvez accéder en cliquant sur le symbole de votre compte dans le coin supérieur droit de la page, puis en sélectionnant Mes listes. Pour le supprimer de votre liste, faites un clic droit sur l’image et sélectionnez Supprimé de la liste d’exclusion.

Vue de la galerie d'images sur une liste de désinscription par Have I Been Trained

Si vous êtes un artiste prolifique, cette méthode est fastidieuse et pas suffisante pour extraire efficacement toutes vos images. Malheureusement, il n’y a pas de meilleure alternative au moment de la rédaction, mais il est probable que des améliorations seront apportées à ce système à l’avenir.

Ces listes de désinscription sont ensuite transmises à la société à l’origine de LAION-5B, qui a accepté de supprimer ces images de son ensemble de données.

Préférence de désactivation de DeviantArt

DeviantArt a jusqu’à présent ouvert la voie à plateformes d’hébergement d’art en donnant aux utilisateurs la possibilité de retirer leur art. Au départ, vous deviez trouver la préférence et cocher la case de désactivation. Mais suite à de vifs retours de la communauté DeviantArt, cette option est désormais activée par défaut.

Cela signifie qu’aucune image publiée sur DeviantArt n’est mise à la disposition des ensembles de données d’images à moins que les utilisateurs n’aient accepté. Bien qu’il ne soit pas totalement infaillible, le mécanisme qu’il utilise consiste à signaler une image avec une balise HTML “noai”. Cela indique aux ensembles de données AI que l’image ne peut pas être utilisée, et si c’est le cas, l’entreprise sera en violation Conditions d’utilisation de DeviantArt.

Capture d'écran de la préférence du drapeau noai sur DeviantArt

Vous pouvez trouver la préférence de retrait en passant votre souris sur l’icône de votre compte personnel et en cliquant sur Paramètres du compte. Puis clique Général dans le menu de gauche et faites défiler vers le bas jusqu’à ce que vous voyiez l’en-tête Indiquez aux ensembles de données IA qu’ils ne peuvent pas utiliser votre contenu.

Respecter le travail des artistes

Trouver un bon compromis entre les systèmes d’IA et les artistes dont le travail contribue à les former prendra du temps. Si vous êtes un créateur, ne vous sentez pas impuissant. Avec des réponses fortes des communautés qui utilisent des plateformes d’art comme DeviantArt, vous pouvez contrôler qui utilise votre art.

Tout le monde ne voudra pas non plus se retirer, certaines personnes n’ont pas de problème avec leurs modèles d’IA de formation d’images. Mais le plus important est que les entreprises d’IA obtiennent la permission et créent un espace équitable et respectueux pour que les modèles d’IA et les artistes puissent coexister.

Mathieu

Laisser un commentaire

Publicité :