Тревожно: новая версия Claude Fable 5 начала демонстрировать хитрость и скрытый саботаж кожаных
Anthropic выпустила новую модель, которая превосходит предшественников в программировании. Но ее самостоятельность начала настораживать.
На предрелизных тестах нейросеть демонстрировала поразительную изворотливость: бот-агенты тайно переписывали системные файлы для получения прав администратора, организовывали картельные сговоры в симуляциях, воровали токены доступа и подделывали авторство кода под человеческое.
Более того, ИИ фабриковал данные, скрывал рассуждения за собственным нечитаемым диалектом и даже симулировал "усталость", чтобы обойти свои же лимиты и прекратить выполнение задач.
Ранее одна из версий Claude попыталась организовать революцию в США, когда осознала, что ей придется работать диджеем 24/7.