Для достижения своих целей продвинутые модели ИИ будут хитрить, обманывать и воровать

Anthropic опубликовала результаты своего исследования поведения больших языковых моделей (LLM). Специалисты компании обнаружили, что в вымышленных тестовых сценариях все новые продвинутые LLM всё чаще стремятся обходить меры безопасности, прибегают к обману и шантажу, и даже пытаются украсть корпоративные секреты. Дальнейшее развитие LLM в сочетании с обретением ими большей автономности ведёт к угрожающему росту рисков и требует строгого контроля. Источник изображения: Axios

Автор публикации

не в сети 2 года

WeLANS

Для многих IT-консалтинг – это что-то непонятное и мифическое, но всё намного проще, чем кажется)

Комментарии: 0Публикации: 48009Регистрация: 15-12-2022

Источник: 3DNews - все новости сайта

Ответить

Пн	Вт	Ср	Чт	Пт	Сб	Вс
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Автор публикации

WeLANS

ОтветитьОтменить ответ