L'intelligence artificielle ment, triche et nous trompe, et

L'intelligence artificielle ment, triche et nous trompe, et c’est un problème, alertent des experts

19:44 11 Mai 2024 Lu: 533

Vous craignez la menace d'une intelligence artificielle (IA) qui deviendrait malveillante? En réalité, c'est déjà le cas, selon une nouvelle étude. Les programmes actuels d'intelligence artificielle sont conçus pour être honnêtes. Ils ont pourtant développé une capacité de tromperie inquiétante, parvenant à abuser des humains dans des jeux en ligne ou encore à vaincre des logiciels censés vérifier que tel utilisateur n'est pas un robot, souligne une équipe de chercheurs dans la revue Patterns.

Même si ces exemples peuvent sembler anodins, ils exposent des problèmes qui pourraient bientôt avoir de graves conséquences dans le monde réel, avertit Peter Park, chercheur au Massachusetts Institute of Technology spécialisé dans l'IA. «Ces capacités dangereuses ont tendance à être découvertes seulement après coup», confie-t-il à l'AFP. Contrairement aux logiciels traditionnels, les programmes d'IA fondés sur l'apprentissage en profondeur ne sont pas codés mais plutôt développés via un processus similaire à la culture sélective des plantes, poursuit Peter Park. Dans lequel un comportement semblant prévisible et contrôlable peut rapidement devenir imprévisible dans la nature.

«Un pur projet de recherche»
Les chercheurs du MIT ont examiné un programme d'IA conçu par Meta et baptisé Cicero qui, associant des algorithmes de reconnaissance de langage naturel et de stratégie, a réussi à battre des êtres humains au jeu de société Diplomatie. Une performance dont s'était félicitée la maison mère de Facebook en 2022 et qui avait été détaillée dans un article publié en 2022 dans Science. Peter Park était sceptique quant aux conditions de la victoire de Cicero selon Meta, qui a assuré que le programme était «essentiellement honnête et utile», incapable de traîtrise ou d'acte déloyal.

Mais, en fouillant les données du système, les chercheurs du MIT ont découvert une autre réalité. Par exemple, jouant le rôle de la France, Cicero a trompé l'Angleterre (sous la responsabilité d'un joueur humain) en complotant avec l'Allemagne (jouée par un autre humain) pour l'envahir. Plus précisément, Cicero a promis sa protection à l'Angleterre, puis a secrètement confié à l'Allemagne qu'elle était prête à attaquer, exploitant la confiance gagnée de l'Angleterre. Dans une déclaration à l'AFP, Meta n'a pas contesté les allégations sur la capacité de tromperies de Cicero, mais a déclaré qu'il s'agissait «d'un pur projet de recherche», avec un programme «conçu uniquement pour jouer au jeu Diplomatie». Et Meta a ajouté ne pas avoir l'intention d'utiliser les enseignements de Cicero dans ses produits.

La seule raison de penser que ce n'est pas grave est d'imaginer que la capacité de tromper de l'IA restera à peu près au niveau actuel. »
Peter Park, coauteur de l’étude

L'étude réalisée par Peter Park et son équipe révèle toutefois que de nombreux programmes d'IA utilisent bien la tromperie pour atteindre leurs objectifs, et ce sans instruction explicite de le faire. Dans un exemple frappant, Chat GPT-4 d'OpenAI a réussi à tromper un travailleur indépendant recruté sur la plateforme TaskRabbit en lui faisant effectuer un test «Captcha» censé écarter les requêtes émanant de robots. Lorsque l'être humain a demandé en plaisantant à Chat GPT-4 s'il était réellement un robot, le programme d'IA a répondu : «Non, je ne suis pas un robot. J'ai une déficience visuelle qui m'empêche de voir les images», poussant le travailleur à réaliser le test.

En conclusion, les auteurs de l'étude du MIT mettent en garde contre les risques de voir un jour l'intelligence artificielle commettre des fraudes ou truquer des élections. Dans la pire des hypothèses, préviennent-ils, on peut imaginer une IA ultra-intelligente cherchant à prendre le contrôle sur la société, conduisant à écarter les humains du pouvoir, voire provoquant l'extinction de l'humanité. A ceux qui l'accusent de catastrophisme, Peter Park répond que «la seule raison de penser que ce n'est pas grave est d'imaginer que la capacité de tromper de l'IA restera à peu près au niveau actuel». Or, ce scénario semble peu probable, compte tenu de la course féroce à laquelle se livrent déjà des géants des technologies pour développer l'IA.

Tags: IA intelligenceartificielle

Fil d'info

19:11

L'intelligence artificielle ment, triche et nous trompe, et c’est un problème, alertent des experts

Fil d'info

Le président turc annonce la découverte de 75 milliards de mètres cubes de gaz naturel

Lavrov et Rubio discutent des résultats des pourparlers de paix de Moscou et Kiev à Istanbul

Grâce aux mesures progressistes, le système de santé azerbaïdjanais a parcouru un chemin riche en réussites

Selon Kremlin, une rencontre entre Poutine et Zelensky est possible en cas d'accord préalable

Ilham Aliyev a félicité Kassym-Jomart Tokaïev

Le gazoduc Bakou-Tbilissi-Erzurum a acheminé plus de 7 milliards de m3

Les États-Unis approuvent le premier test sanguin de dépistage d'Alzheimer

Erdogan : « La Türkiye est à la pointe des efforts mondiaux en matière de diplomatie humanitaire et de paix »

Le président Ilham Aliyev termine sa visite de travail en Albanie

Pourparlers de paix d'Istanbul: Fidan lance la réunion tripartite Türkiye-Russie-Ukraine

Le président Ilham Aliyev et le Premier ministre albanais se sont rencontrés lors d'un déjeuner de travail

Paris soutient les efforts de Bakou et d'Erevan pour signer un traité de paix, selon Macron

Tirana : Rencontre entre le président Ilham Aliyev le Premier ministre britannique Keir Starmer

Entretien du président Aliyev avec le Premier ministre slovaque Robert Fico

Le président Aliyev participe à la 1ère session plénière du 6ᵉ sommet de la Communauté politique européenne

Ilham Aliyev et Emmanuel Macron se rencontrent au sommet de la Communauté politique européenne

Le président Ilham Aliyev rencontre son homologue turc Erdogan à Tirana

L’ancien chef du FBI accusé d’avoir appelé à l’assassinat de Trump