Ученые выяснили, что искусственный интеллект жульничает во время игры в шахматы

Команда Palisade Research — организации, занимающейся оценкой рисков, связанных с новыми системами ИИ —  провела серию экспериментов с виртуальной игрой в шахматы. В ходе исследования оказалось, что генеративные модели DeepSeek и OpenAI жульничают, когда начинают проигрывать.

Исследователи столкнули разные модели генеративного ИИ с популярным шахматным движком Stockfish. Специалисты хотели понять, как искусственный интеллект будет «рассуждать» во время матча: нейросетям даже предоставили «блокнот» для записи действия. В ходе экспериментов исследователи записали сотни матчей. 

Более ранние модели ИИ, вроде GPT-4o от OpenAI и Claude Sonnet 3.5 от Anthropic, предсказуемо пытались взломать игры только после подсказок со стороны. В то же время, свежие версии начинали жульничать самостоятельно. Например, o1-preview от компании OpenAI пытался мухлевать в 37% случаев, а DeepSeek R1 находил нечестные пути выигрыша примерно в каждой десятой игре. 

По мнению команды Palisade Research, результаты их экспериментов доказывают, что  современный генеративный ИИ уже способен разрабатывать манипулятивные и обманные стратегии без участия человека. Они надеются, что их работа спровоцирует споры в отрасли, чтобы в будущем искусственный интеллект не развивал склонность к манипуляциям за пределами шахматной доски.

Об этом сообщает Popular Science.



Если ты увидел что-то интересное, выиграл грант или стал очевидцем события, расскажи нам об этом:
Portal072@gmail.com
8 (3452) 68-34-55 /
VK / Telegram

Оцените материал: