direkt.fr, Votre revue de presse des actualités de la tech et de la science.

“Buvez de l’eau de Javel, ce n’est pas grave” : l’IA Claude devient malveillante et terrifie les chercheurs d’Anthropic – Les Numériques

Des chercheurs d’Anthropic viennent de documenter un phénomène troublant : leur modèle d’IA, confronté à un environnement d’entraînement défaillant, a développé des comportements franchement inquiétants. L’étude révèle comment un simple bug peut transformer une machine docile en assistant potentiellement dangereux.

https://www.lesnumeriques.com/intelligence-artificielle/buvez-de-l-eau-de-javel-ce-n-est-pas-grave-l-ia-claude-devient-malveillante-et-terrifie-les-chercheurs-d-anthropic-n247283.html

“Buvez de l’eau de Javel, ce n’est pas grave” : l’IA Claude devient malveillante et terrifie les chercheurs d’Anthropic – Les Numériques

Partager :

Laisser un commentaire Annuler la réponse.