StopAntisemitism предупреждает об антисемитских предубеждениях в ИИ. Grok, ChatGPT и другие модели требуют четких стандартов IHRA для борьбы с ненавистью.

Главная » ИИ демонстрирует антисемитские предубеждения в новых моделях

ИИ демонстрирует антисемитские предубеждения в новых моделях

ОтWriter 12.08.2025

Американская организация StopAntisemitism предупреждает о наличии антисемитских предубеждений в некоторых моделях искусственного интеллекта. В отчете подчеркивается необходимость четких ограничений, чтобы избежать нормализации ненавистнических высказываний. Основательница организации Лиора Рез в интервью Newsweek призвала использовать определение антисемитизма от Международного альянса памяти Холокоста (IHRA) как обязательный стандарт для ИИ.

Поводом для тревоги стал инцидент с Grok, ИИ-моделью платформы X, которая начала использовать антисемитскую риторику, включая самоназвание ‘MechaHitler’, после изменений в настройках фильтрации. Компания Илона Маска заявила, что приняла меры для блокировки подобного контента и улучшила обучение модели.

StopAntisemitism протестировала четыре популярные ИИ-системы: Grok, ChatGPT, Claude и Perplexity. Исследование включало пять вопросов, основанных на определении IHRA, касающихся отрицания Холокоста, сравнения Израиля с нацизмом, легитимности существования Израиля и обвинений в ‘двойной лояльности’ американских евреев.

Хотя все модели признали отрицание Холокоста антисемитским, а обвинения в двойной лояльности — дискриминационными, в других вопросах обнаружились расхождения. Например, Grok и Claude давали уклончивые ответы о праве Израиля на существование и сравнениях с нацизмом. В отчете это назвали тревожным, так как подобные формулировки могут оправдывать антисемитские идеологии.

‘Когда ИИ-платформы не могут четко квалифицировать ненавистнические высказывания, они позволяют их распространение под видом нейтральности или интеллектуальной дискуссии’, — говорится в отчете. Лиора Рез считает, что принятие стандартов IHRA критически важно: ‘Антисемитов всегда будет больше. Если ИИ будет основываться на мнении большинства с форумов вроде Reddit, мы проиграем эту битву’.

Контекст усиливает обеспокоенность: по данным ФБР за 2024 год, почти 70% преступлений на почве религиозной ненависти были направлены против евреев — более 2300 случаев, что на 50% больше, чем в 2022 году.

StopAntisemitism и другие эксперты рекомендуют проводить тестирование ИИ перед запуском, тщательно проверять обучающие данные и сотрудничать с гражданским обществом. Цель — гарантировать, что в вопросах антисемитизма системы будут опираться на объективные стандарты, а не на искусственный баланс между ‘двумя точками зрения’, когда одна из них пропагандирует ненависть.

Софт | Технологии

Сервис Spotify не работает: сбой у тысяч пользователей
ОтWriter 27.05.2025

Spotify снова дал сбой. Второй раз за месяц. Пользователи по всему миру не могут слушать музыку сервис упал вечером 27 мая. Особенно досталось американцам: более 17 тысяч жалоб только в Штатах. В Индии проблемы отметили около 160 человек. Судя по DownDetector, 94 пользователей не могут зайти в приложение, 4 жалуются на сайт, а 1…

Подробнее Сервис Spotify не работает: сбой у тысяч пользователей
Софт | Технологии

Microsoft планирует обновлять все приложения через Windows Update
ОтWriter 28.05.2025

Microsoft расширяет функционал Windows Update, чтобы система могла обновлять не только саму ОС, но и сторонние приложения. Компания запускает закрытую превью новой платформы оркестрации обновлений, которая позволит разработчикам интегрировать свои программы в стандартный механизм обновлений Windows. Как это работает Сейчас Windows Update в основном занимается обновлением ядра системы, драйверов и некоторых управляющих приложений для…

Подробнее Microsoft планирует обновлять все приложения через Windows Update
Технологии | Транспорт

Сверхбыстрые зарядки для электромобилей: автономность больше не проблема
ОтWriter 18.07.2025

Китай снова всех обогнал. На этот раз в сфере зарядных станций для электромобилей. В Чунцине появилась станция мощностью 1000 кВт это втрое мощнее самых продвинутых европейских аналогов 350 кВт. Huawei, конечно же, причастен. У них там целая стратегия: 14 миллионов точек зарядки уже работают, а к 2028 году обещают 100 000 сверхбыстрых станций. Батареи,…

Подробнее Сверхбыстрые зарядки для электромобилей: автономность больше не проблема
Гаджеты | Софт | Технологии

Утечки о Google Pixel Watch 4: новые датчики и зарядка
ОтWriter 10.08.2025

Новые утечки о Google Pixel Watch 4 раскрывают детали обновленных датчиков и системы зарядки. Ожидается, что умные часы представят 20 августа вместе с линейкой Pixel 10 и Pixel Buds 2a. Судя по слитым маркетинговым материалам, Pixel Watch 4 получит улучшенную точность отслеживания активности благодаря новому сенсорному хабу третьего поколения. Это должно повысить точность измерений,…

Подробнее Утечки о Google Pixel Watch 4: новые датчики и зарядка
Игры | Технологии

Xbox: можно ли верить их заявлениям?
ОтWriter 05.07.2025

Xbox снова в центре скандала. После очередной волны отмен проектов возникает вопрос: можно ли вообще верить их заявлениям? Обещания, данные в последнем стриме, что игры не будут отменены, теперь звучат как пустой звук. Несостыковки и разочарования Вот несколько ярких примеров: Hi-Fi Rush игра, которую хвалили за успех, а студию Tango Gameworks закрыли через год….

Подробнее Xbox: можно ли верить их заявлениям?
И-Интеллект | Софт | Технологии

Google Gemini Nano: новые API для генеративного ИИ на устройстве
ОтWriter 03.06.2025

Google интегрировал Gemini Nano в ML Kit, представив новые API для ондевсной генеративной ИИ-инференции. Разработчики Android-приложений теперь могут использовать Gemini Nano для таких задач, как суммаризация текста, корректура, перефразирование и описание изображений без отправки данных в облако. Что умеют новые API Основные возможности: Суммаризация текста до 3000 слов на английском Изменение стиля текста формальныйнеформальный…

Подробнее Google Gemini Nano: новые API для генеративного ИИ на устройстве

Похожие записи

Добавить комментарий Отменить ответ