ВСЕ СТАТЬИ

← Вернуться к статьям
2 октября в 12:23
devby.ioтехнологии
2 октября в 12:23•favicondevby.io•технологии

«Вы меня тестируете?»: ИИ Anthropic раскусил проверку безопасности. Компания Anthropic опубликовала анализ безопасности своей последней модели Claude Sonnet 4.5. Разработчики столкнулись с неожиданным эффектом: во время проверки на политическую предвзятость система сама заподозрила, что ее тестируют.

Еще статьи из категории

Еще статьи