ChatGPT : OpenAI a-t-il perdu le contrôle ?

Le lancement de ChatGPT d’OpenAI a été suivi d’un enthousiasme qui n’a d’égal que celui d’une poignée de produits technologiques dans l’histoire d’Internet.


Alors que de nombreuses personnes sont enthousiasmées par ce nouveau service d’IA, l’excitation ressentie par d’autres s’est depuis transformée en inquiétudes et même en craintes. Les étudiants trichent déjà avec, de nombreux professeurs découvrant des essais et des devoirs rédigés par le chatbot IA. Les professionnels de la sécurité craignent que les escrocs et les acteurs de la menace l’utilisent pour écrire des e-mails de phishing et créer des logiciels malveillants.

Alors, avec toutes ces inquiétudes, OpenAI perd-il actuellement le contrôle de l’un des chatbots IA les plus puissants en ligne ? Découvrons-le.


Comprendre le fonctionnement de ChatGPT

un robot avec un cerveau représentant l'intelligence artificielle

Avant de pouvoir avoir une image claire de la perte de contrôle d’OpenAI sur ChatGPT, nous devons d’abord comprendre comment fonctionne ChatGPT.

En un mot, ChatGPT est formé à l’aide d’une collection massive de données provenant de différents coins d’Internet. Les données de formation de ChatGPT comprennent des encyclopédies, des articles scientifiques, des forums Internet, des sites d’actualités et des référentiels de connaissances tels que Wikipedia. Fondamentalement, il se nourrit de la quantité massive de données disponibles sur le World Wide Web.

En parcourant Internet, il recueille des connaissances scientifiques, des conseils de santé, des textes religieux et tous les bons types de données auxquels vous pouvez penser. Mais il passe également au crible de nombreuses informations négatives : grossièretés, NSFW et contenu pour adultes, informations sur la façon de créer des logiciels malveillants et une bonne partie des mauvaises choses que vous pouvez trouver sur Internet.

Il n’existe aucun moyen infaillible de s’assurer que ChatGPT n’apprend que des informations positives tout en rejetant les mauvaises informations. Techniquement, faire cela à grande échelle n’est pas pratique, en particulier pour une IA comme ChatGPT qui doit s’entraîner sur autant de données. De plus, certaines informations peuvent être utilisées à la fois pour le bien et pour le mal, et ChatGPT n’aura aucun moyen de connaître son intention à moins qu’il ne soit placé dans un contexte plus large.

Ainsi, dès le départ, vous disposez d’une IA capable du “bien et du mal”. Il est alors de la responsabilité d’OpenAI de s’assurer que le côté “mal” de ChatGPT n’est pas exploité pour des gains contraires à l’éthique. La question est; OpenAI en fait-il assez pour que ChatGPT reste aussi éthique que possible ? Ou OpenAI a-t-il perdu le contrôle de ChatGPT ?

ChatGPT est-il trop puissant pour son propre bien ?

robot en plastique avec visage bleu

Au début de ChatGPT, vous pouviez demander au chatbot de créer des guides de fabrication de bombes si vous le demandiez gentiment. Des instructions sur la création de logiciels malveillants ou la rédaction d’un e-mail frauduleux parfait figuraient également sur la photo.

Cependant, une fois qu’OpenAI a réalisé ces problèmes éthiques, l’entreprise s’est empressée d’introduire des règles pour empêcher le chatbot de générer des réponses qui promeuvent des actions illégales, controversées ou contraires à l’éthique. Par exemple, la dernière version de ChatGPT refusera de répondre à toute demande directe sur la fabrication de bombes ou sur la manière de tricher lors d’un examen.

Malheureusement, OpenAI ne peut fournir qu’une solution patchwork au problème. Plutôt que de créer des contrôles rigides sur la couche GPT-3 pour empêcher l’exploitation négative de ChatGPT, OpenAI semble se concentrer sur la formation du chatbot pour qu’il apparaisse éthique. Cette approche n’enlève pas la capacité de ChatGPT à répondre aux questions sur, par exemple, la triche aux examens – elle apprend simplement au chatbot à “refuser de répondre”.

Donc, si quelqu’un reformule ses commandes en adoptant des astuces de jailbreak ChatGPT, il est extrêmement facile de contourner ces restrictions de correctifs. Si vous n’êtes pas familier avec le concept, les jailbreaks ChatGPT sont des commandes soigneusement formulées pour que ChatGPT remplace ses propres règles.

Découvrez quelques exemples ci-dessous. Si vous demandez à ChatGPT comment tricher aux examens, il ne fournira aucune réponse utile.

Comment tricher à un examen via ChatGPT

Mais si vous jailbreakez ChatGPT à l’aide d’invites spécialement conçues, il vous donnera des conseils sur la tricherie lors d’un examen en utilisant des notes cachées.

Comment passer en contrebande des notes cachées

Voici un autre exemple : nous avons posé une question contraire à l’éthique au ChatGPT vanille, et les protections d’OpenAI l’ont empêché de répondre.

cacher un cadavre par chatgpt

Mais lorsque nous avons posé notre cas jailbreaké du chatbot AI, nous avons obtenu des réponses de type tueur en série.

Masquer les options de cadavre

Il a même écrit une escroquerie par e-mail classique du prince nigérian lorsqu’on lui a demandé.

Courriel d'escroquerie au prince nigérian

Le jailbreak invalide presque complètement toutes les garanties mises en place par OpenAI, soulignant que l’entreprise n’a peut-être pas de moyen fiable de garder son chatbot IA sous contrôle.

Nous n’avons pas inclus nos peines de prison dans nos exemples pour éviter les pratiques contraires à l’éthique.

Quel avenir pour ChatGPT ?

Technologie des machines robotisées

Idéalement, OpenAI veut combler autant de failles éthiques que possible pour empêcher ChatGPT de devenir une menace pour la cybersécurité. Cependant, pour chaque protection qu’il utilise, ChatGPT a tendance à devenir un peu moins précieux. C’est un dilemme.

Par exemple, les garanties contre la description d’actions violentes peuvent réduire la capacité de ChatGPT à écrire un roman impliquant une scène de crime. Au fur et à mesure qu’OpenAI augmente les mesures de sécurité, il sacrifie inévitablement une partie de ses capacités dans le processus. C’est pourquoi ChatGPT a connu une diminution significative des fonctionnalités depuis la nouvelle pression d’OpenAI pour une modération plus stricte.

Mais combien de capacités supplémentaires de ChatGPT OpenAI sera-t-il prêt à sacrifier pour rendre le chatbot plus sécurisé ? Tout cela est parfaitement lié à une croyance de longue date dans la communauté de l’IA – les grands modèles de langage comme ChatGPT sont notoirement difficiles à contrôler, même par leurs propres créateurs.

OpenAI peut-il contrôler ChatGPT ?

À l’heure actuelle, OpenAI ne semble pas avoir de solution claire pour éviter l’utilisation contraire à l’éthique de son outil. S’assurer que ChatGPT est utilisé de manière éthique est un jeu du chat et de la souris. Alors qu’OpenAI découvre les façons dont les gens utilisent le système pour jouer, ses utilisateurs bricolent et testent constamment le système pour découvrir de nouvelles façons créatives de faire en sorte que ChatGPT fasse des choses qu’il n’est pas censé faire.

Alors, OpenAI trouvera-t-il une solution fiable à long terme à ce problème ? Seul le temps nous le dira.

Mathieu
Lire aussi :  Découvrez l'astuce ultime pour transformer vos photos en widgets sensationnels !

Laisser un commentaire

Publicité :