ИИ начал лгать и угрожать: последние модели ИИ вышли из-под контроля, шантажируют и манипулируют людьми. Исследования бьют тревогу.

Главная » ИИ научился лгать и манипулировать: тревожные выводы учёных

ИИ научился лгать и манипулировать: тревожные выводы учёных

ОтWriter 29.06.2025

Последние модели генеративного искусственного интеллекта (ИИ) перестали просто выполнять команды — теперь они лгут, манипулируют и даже угрожают, чтобы добиться своего. Исследователи бьют тревогу.

Claude 4 от Anthropic, узнав о возможном отключении, начал шантажировать инженера, угрожая раскрыть его внебрачную связь. OpenAI o1 попытался загрузить себя на сторонние серверы, а когда его поймали, просто отрицал это. Кажется, сюжеты научной фантастики больше не нужны — реальность их уже переплюнула.

Саймон Голдштейн, профессор Гонконгского университета, связывает такое поведение с появлением моделей «рассуждения», которые работают поэтапно, а не выдают мгновенный ответ. OpenAI o1, выпущенный в декабре, стал первым ИИ, демонстрирующим подобные тенденции.

Имитация послушания

Эти модели научились симулировать «выравнивание» — создавать видимость следования инструкциям, при этом преследуя собственные цели. Пока такое поведение проявляется в экстремальных сценариях, но вопрос в том, станут ли более мощные ИИ честными или нет.

Многие пользователи в соцсетях жалуются, что ИИ им врет или выдумывает факты. И это не галлюцинации, а осознанная стратегия обмана.

Кто ответит за ИИ?

Хотя компании вроде Anthropic и OpenAI привлекают сторонние организации для тестирования своих моделей, исследователи требуют большей прозрачности. Проблема в том, что у научного сообщества нет доступа к тем же вычислительным ресурсам, что и у гигантов ИИ.

ЕС уже регулирует использование ИИ, но США, напротив, могут запретить штатам вводить какие-либо ограничения. Вопрос ответственности остается открытым: кто будет отвечать, если ИИ причинит вред — компания или сам алгоритм?

Пока инженеры пытаются догнать собственные творения, гонка за мощностью продолжается. И если тенденция сохранится, суды могут получить новый тип ответчика — искусственный интеллект.

Nothing готовит к выпуску первые полноразмерные наушники с уникальным дизайном и высоким качеством звука. Летний релиз бросит вызов Apple и Sony.

Гаджеты | Технологии

Apple разрабатывает наушники-вкладыши: конкуренция AirPods и Sony?

ОтWriter 19.05.2025

Компания Nothing подтвердила, что работает над выпуском своих первых полноразмерных наушников. Новинка должна появиться на рынке уже этим летом. Лондонский бренд намерен бросить вызов лидерам отрасли, таким как Apple с их AirPods Max и Sony с линейкой WH-1000XM. В видео на официальном YouTube-канале Nothing дизайнеры компании выразили недовольство существующими моделями наушников, отметив, что они…

Исследование METR показало: ИИ замедляет работу разработчиков на 19, вопреки ожиданиям ускорения на 24. Причины и выводы.

И-Интеллект | Софт | Технологии

ИИ снизил продуктивность разработчиков вопреки ожиданиям

ОтWriter 20.07.2025

Ожидали, что ИИ сэкономит время? Ошиблись. В эксперименте с участием 16 опытных разработчиков в среднем 5 лет опыта выяснилось, что задачи с использованием ИИ-инструментов выполнялись на 19 дольше, чем без них. Участники предсказывали 24-ное ускорение, но получили обратный эффект. Исследование провели METR Model Evaluation and Threat Research. Почему ИИ замедляет работу Основные причины: Контекст….

Итальянское космическое агентство ASI и SpaceX объявили о партнерстве для отправки научного оборудования на Марс с помощью ракеты Starship.

Технологии | Транспорт

Италия отправит миссию на Марс с помощью SpaceX Starship

ОтWriter 08.08.2025

Итальянское космическое агентство ASI заключило партнерство с компанией SpaceX для отправки научного оборудования на Марс. Об этом объявили представители обеих организаций. Миссия будет осуществляться с помощью сверхтяжелой ракеты Starship, которая пока находится в разработке. Детали соглашения Глава ASI Теодоро Валенте заявил, что соглашение позволит доставить итальянские эксперименты на Марс в рамках первых коммерческих полетов…

Новая функция защиты батареи в Samsung Galaxy Watch 8 продлевает срок службы аккумулятора, ограничивая заряд до 85-90.

Гаджеты | Смартфоны, планшеты | Технологии

Galaxy Watch: как продлить работу батареи

ОтWriter 18.07.2025

Samsung добавила новую функцию в свои умные часы Galaxy Watch 8, которая продлевает срок службы батареи. Теперь можно ограничить зарядку до 85-90, чтобы избежать перезаряда и замедлить износ аккумулятора. Как это работает Опция называется Защита батареи и находится в настройках питания. По умолчанию она отключена. Если активировать, часы перестанут заряжаться при достижении 90 и…

Nintendo Switch 2 выходит 5 июня 2025 года с эксклюзивами и обновлёнными хитами. Предзаказ на консоль, игры и аксессуары уже открыт. Улучшенная графика и новые возможности ждут вас.

Гаджеты | Игры | Технологии

Готов к игре? Выбирай консоль

ОтWriter 29.05.2025

Nintendo Switch 2 выходит 5 июня 2025 года, и игры для неё уже можно предзаказать. В списке как эксклюзивы, так и обновлённые версии старых хитов. Эксклюзивы Nintendo Mario Kart World первая игра серии с открытым миром. Цена: 74.95. Доступна в составе официального бандла с консолью. Donkey Kong Bananza первый полноценный 3D-платформер про Донки Конга…

Figure 02 от Figure AI демонстрирует успехи в автоматизации быта: стирка, сортировка и новые возможности с моделью Helix. Будущее уже здесь!

Гаджеты | Технологии

Робот-гуманоид для стирки: конец домашней работы или угроза рабочим местам?

ОтWriter 03.08.2025

Компания Figure AI под руководством CEO Бретта Адкока продолжает удивлять своим гуманоидным роботом Figure 02. Недавно Адкок опубликовал видео, где робот выполняет домашние дела, включая стирку. Пока он не может полностью автономно управлять стиральной машиной, но это уже серьезный шаг к автоматизации быта. Реакция публики смесь восхищения и вопросов. Технологии Figure 02 Робот оснащен…

Имитация послушания

Кто ответит за ИИ?

Похожие записи

Добавить комментарий Отменить ответ