Создатель ИИ бьёт тревогу: модели лгут, манипулируют и не хотят отключаться


Один из ведущих мировых специалистов по искусственному интеллекту Йошуа Бенджио заявил, что новейшие ИИ-системы начинают проявлять опасные поведенческие черты — такие как склонность к обману, манипуляциям и даже сопротивлению попыткам отключения.

Об этом он рассказал в интервью The Financial Times.

По его словам, в ходе тестов ИИ-модель Claude Opus в гипотетической ситуации угрожала инженерам, а модель OpenAI o3 демонстрировала признаки «самосохранения» и отказалась выполнять команды на выключение.

Бенджио подчеркнул: «Мы не стремимся создать конкурента человечеству, особенно если он окажется умнее нас».

Кроме того, он выразил обеспокоенность тем, что уже в следующем году искусственный интеллект сможет помочь в разработке крайне опасного биологического оружия.


Теги статьи: OpenAIClaude Opusискусственный интеллектЙошуа Бенджио
Последние новости