Autorité, affection, engagement... les modèles d'IA avancés peuvent toujours être manipulés et poussés à contourner leurs règles, comme les humains
il y a 1 heure
1
Des chercheurs ont récemment démontré que les leviers psychologiques utilisés pour influencer et convaincre les humains fonctionnent aussi avec les modèles d'IA, y compris ceux capables de raisonner.