Google Gemini Nano: новые API для генеративного ИИ на устройстве
Google интегрировал Gemini Nano в ML Kit, представив новые API для ондевсной генеративной ИИ-инференции. Разработчики Android-приложений теперь могут использовать Gemini Nano для таких задач, как суммаризация текста, корректура, перефразирование и описание изображений — без отправки данных в облако.
Основные возможности:
- Суммаризация текста до 3000 слов на английском
- Изменение стиля текста (формальный/неформальный)
- Генерация заголовков, метаданных и альтернативных описаний изображений
Все операции выполняются локально на устройстве, что гарантирует конфиденциальность данных и отсутствие облачных расходов.
Как это работает
Архитектура API построена на нескольких слоях:
- Gemini Nano как базовая модель
- API-специфичные LoRA-адаптеры для улучшения качества
- Оптимизированные параметры инференции (промпты, температура, top-K)
- Оценочный конвейер с автоматическими и человеческими оценками
Google утверждает, что такой подход обеспечивает качественные результаты без необходимости тонкой настройки или сложного промпт-инжиниринга.
Поддержка устройств
API работают на Android-устройствах с чипами MediaTek Dimensity, Qualcomm Snapdragon и Google Tensor через AICore. Среди поддерживаемых устройств:
- Pixel 9
- Samsung Galaxy 25
- Xiaomi 15
- Motorola Razr 60 Ultra
Как начать использовать
Для тестирования доступны:
- Демо-приложение с примерами использования всех API
- Официальная документация с руководствами по интеграции
Модели загружаются автоматически при первом использовании API, но разработчики могут предварительно скачать их вручную.