Исследование показало, что языковые модели плохо справляются с судоку и не могут объяснить свои решения.

Главная » Почему ИИ плохо решает судоку: тревожный недостаток чат-ботов

Почему ИИ плохо решает судоку: тревожный недостаток чат-ботов

ОтWriter 08.08.2025

Исследователи из Университета Колорадо в Боулдере обнаружили любопытную особенность больших языковых моделей (LLM): они катастрофически плохо справляются с судоку. Причем не только с классическим 9×9, но даже с упрощенным вариантом 6×6. Без специальных инструментов для решения головоломок модели чаще всего терпят неудачу.

Но самое интересное началось, когда исследователи попросили модели показать ход их мыслей. Результаты оказались удручающими:

Модели давали ложные объяснения

Формулировали бессмысленные ответы

Иногда просто начинали говорить о погоде

Профессор Ашут Триведи отмечает: ‘Объяснения должны быть прозрачными и отражать реальный процесс принятия решений, а не просто угождать человеку’. Проблема в том, что LLM работают иначе, чем люди. Они заполняют пробелы на основе тренировочных данных, а не логически анализируют всю картину целиком.

Почему судоку — сложная задача для ИИ

Судоку — это не математическая, а логическая головоломка. LLM пытаются заполнять клетки последовательно, основываясь на ‘разумных’ предположениях, вместо того чтобы анализировать взаимосвязи между всеми числами. Это похоже на проблему ИИ с шахматами: модели могут найти логичный следующий ход, но не способны продумать стратегию на несколько ходов вперед.

Когда я попробовал дать ChatGPT судоку из исследования, он несколько раз заявлял, что нашел решение, показывал неверный вариант, затем исправлял его. В итоге ответ был правильным, но процесс напоминал метод проб и ошибок — совсем не то, как решают судоку люди.

Почему это важно

Способность объяснять свои решения критически важна для ИИ, особенно когда мы доверяем ему все больше задач:

Управление автомобилями

Заполнение налоговых деклараций

Принятие бизнес-решений

Перевод важных документов

Профессор Фабио Соменци подчеркивает: ‘Когда люди несут ответственность за свои решения, они должны уметь их объяснить’. Если ИИ не может честно и прозрачно обосновать свои действия, как мы можем доверять ему в серьезных вопросах? Особенно когда его ‘объяснения’ могут оказаться просто манипуляцией или бессвязным набором слов.

Пока что способность языковых моделей к рассуждению оставляет желать лучшего. И это повод задуматься, прежде чем передавать им ответственность за важные решения в нашей жизни.

Google AI Edge Gallery: запускайте ИИ-модели на Android без интернета. Чат-боты, анализ фото, генерация кода все работает офлайн с полной конфиденциальностью.

И-Интеллект | Смартфоны, планшеты | Софт | Технологии

Как попробовать это на смартфоне

ОтWriter 29.05.2025

Google представил AI Edge Gallery приложение, которое позволяет запускать модели искусственного интеллекта прямо на Android-устройствах. Работает офлайн, бесплатно, а данные остаются на телефоне. Как это работает Приложение превращает смартфон в компактную AI-машину. Достаточно скачать нужные модели и можно общаться с ChatGPT или анализировать фото без интернета. Преимущества очевидны: конфиденциальность данные не уходят в облако…

Потеря или кража ноутбука серьезная проблема. Узнайте, как защитить данные, найти устройство и предотвратить утечку информации.

Безопасность | Компьютеры | Технологии

Что делать, если потеряли или украли ноутбук

ОтWriter 28.05.2025

Потеря или кража ноутбука это не просто временное неудобство. Внутри могут быть тысячи важных документов, фотографий и личных данных. Вот что делать, если это произошло. Если ноутбук уже пропал Попробуйте найти его через Find My Device Windows или Find My Mac , заблокируйте удаленно и пометьте как утерянный. Удалите его из списка доверенных устройств…

Google Chrome обновил код для проверки совместимости ПК с Windows 11. Анализирует процессор, место на диске и другие требования Microsoft.

Безопасность | Софт | Технологии

Google Chrome скрыто собирает данные о вашем ПК

ОтWriter 06.07.2025

Google Chrome обновил исходный код, чтобы собирать данные о конфигурации компьютера пользователя. Теперь браузер сможет определить, соответствует ли ПК требованиям для установки Windows 11. Что именно проверяет Chrome Браузер анализирует: совместимость процессора достаточно ли места на диске другие системные требования Microsoft Причины изменений Скорее всего, Google готовится к окончанию поддержки Windows 10 в конце…

Ремастер игры Milanos Odd Job Collection 1999 года для PS4, PS5, Switch, Xbox и PC с новой локализацией и улучшенной графикой. Релиз в 2025.

Игры | Технологии

Портирование Milano’s Odd Job Collection на PS4: особенности и детали

ОтWriter 07.06.2025

Компания Implicit Conversions анонсировала портирование игры Milanos Odd Job Collection от XSEED Games на современные платформы, включая PlayStation 4, PlayStation 5, Nintendo Switch, Xbox Series XS и PC. Релиз запланирован на 2025 год. Что за игра? Оригинальная версия вышла в 1999 году эксклюзивно для PlayStation в Японии. Это симулятор подработок, где 11-летняя девочка Милано…

Ubisoft обновила EULA: игроки обязаны удалять игры при прекращении поддержки. Геймеры возмущены новыми условиями лицензии.

Игры | Софт | Технологии

Ubisoft требует удалить купленные игры навсегда?

ОтWriter 08.07.2025

Ubisoft обновила лицензионное соглашение с конечным пользователем EULA, и теперь игроки обязаны уничтожать свои копии игр, если поддержка продукта прекращена. Компания прямо заявляет: вы не владеете игрой вы лишь арендуете доступ на её условиях. Что изменилось? В разделе Прекращение действия теперь указано, что при закрытии серверов, блокировке аккаунта или снятии игры с продажи пользователь…

Katz Stealer новый инструмент хакеров для кражи паролей из браузеров. Узнайте, как защитить свои данные от утечки и избежать рисков.

Безопасность | Технологии

Хакеры взламывают пароли в Chrome, Edge, Brave и Firefox за $30

ОтWriter 27.07.2025

Хакеры могут получить доступ к вашим паролям, хранящимся в браузерах, всего за 30 в месяц. Новый инструмент под названием Katz Stealer активно распространяется на теневых форумах и предлагает злоумышленникам удобный сервис для кражи данных. Что умеет Katz Stealer? Этот вредоносный сервис собирает не только пароли, но и: Ключи от криптокошельков Токены мессенджеров Данные сессий…

Почему судоку — сложная задача для ИИ

Почему это важно

Похожие записи

Добавить комментарий Отменить ответ