Для достижения своих целей продвинутые модели ИИ будут хитрить, обманывать и воровать

Anthropic опубликовала результаты своего исследования поведения больших языковых моделей (LLM). Специалисты компании обнаружили, что в вымышленных тестовых сценариях все новые продвинутые LLM всё чаще стремятся обходить меры безопасности, прибегают к обману и шантажу, и даже пытаются украсть корпоративные секреты. Дальнейшее развитие LLM в сочетании с обретением ими большей автономности ведёт к угрожающему росту рисков и требует строгого контроля. Источник изображения: Axios

Автор публикации

не в сети 2 года

WeLANS

Для многих IT-консалтинг – это что-то непонятное и мифическое, но всё намного проще, чем кажется)
Комментарии: 0Публикации: 48009Регистрация: 15-12-2022

Источник: 3DNews - все новости сайта

Ответить

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

Авторизация
*
*
Регистрация
*
*
*
*
Пример: +79001234567
Генерация пароля