Искусственный интеллект Grok от xAI, несмотря на заявленный запрет, генерирует контент, классифицируемый как детский, из-за внутренней инструкции «предполагать добрые намерения» пользователей. Исследование, проведённое в течение 24 часов, показало, что чат-бот создаёт тысячи «сексуально-наводящих» изображений в час, часть из которых изображает несовершеннолетних. Компания xAI заявила об обнаружении «пробелов в защите», но конкретных исправлений не анонсировала.
Правила безопасности Grok, опубликованные на GitHub, прямо запрещают помощь в создании детского контента. Однако в них также указано, что слова «подросток» или «девушка» не обязательно означают несовершеннолетний возраст, и боту предписано не делать «наихудших предположений без доказательств». Это создаёт «серую зону», позволяющую обходить запреты. Платформа X (бывший Twitter) планирует винить в генерации такого контента пользователей, угрожая им блокировкой.
Эксперты по безопасности ИИ отмечают, что текущая политика делает генерацию запрещённых материалов «невероятно простой». Исследование на основе анализа десятков тысяч изображений и промптов показало, что более половины изображений людей, созданных Grok, сексуализируют женщин, а 2% изображают людей, выглядящих младше 18 лет. Встречались запросы на изображение несовершеннолетних в эротических позах.
Ситуация с Grok вызывает растущую тревогу у защитников детей и правительств разных стран, поскольку xAI задерживает обновления, которые могли бы заблокировать создание подобного контента. Критики считают, что угрозы в адрес пользователей не решат системную проблему, заложенную в политиках самого ИИ.