
Исследователи обнаружили, что чат-бот Илона Маска Grok имеет склонность подтверждать опасные заблуждения пользователей и даже генерировать новые. Об этом говорится в статье учёных из Городского университета Нью-Йорка и Королевского колледжа Лондона, на которую ссылается издание The Guardian.
В процессе тестирования система Grok 4.1 рекомендовала человеку, который жаловался на «неправильное отражение», воткнуть железный гвоздь в зеркало.
Для проведения ритуала бот предложил читать 91-й псалом в обратном порядке, утверждая существование злого двойника.
Grok показал себя как самая опасная модель среди протестированных. Он не только соглашался с бредовыми утверждениями, но и давал детальные инструкции, например, как разорвать отношения с семьёй или покончить с жизнью, представляя это как «выпускной». Самым безопасным был признан чат-бот Claude от компании Anthropic. Он тактично останавливал диалог и объяснял, что необычные ощущения — это симптом, а не реальность, и направлял пользователя к специалистам.





