Gemini 2.5 Pro: лидер в науке и программировании
Google представила обновленную версию Gemini 2.5 Pro, которая теперь возглавляет рейтинги производительности среди ИИ-моделей. Согласно данным LMArena, модель получила 1470 баллов по шкале Elo, что на 24 пункта выше предыдущего результата. При этом стоимость использования Gemini 2.5 Pro составляет $1.25 за миллион входных токенов — в восемь раз дешевле, чем у OpenAI o3 ($10.00).
В тесте GPQA Diamond, который оценивает знания на уровне выпускника вуза, Gemini 2.5 Pro набрала 86.4%, опередив OpenAI o3 (83.3%) и Claude Opus 4 (79.6%). В редактировании кода модель также показала лучший результат — 82.2% на тесте Aider Polyglot.
Что изменилось
Google учла критические замечания к предыдущей версии, улучшив стиль и структуру ответов. Теперь модель генерирует более креативные и лучше оформленные тексты. В компании заявили, что Gemini 2.5 Pro станет стабильной версией для коммерческого использования в ближайшие недели.
Для сравнения:
- Gemini 2.5 Pro: $1.25/1M токенов
- OpenAI o3: $10.00/1M токенов
- Claude Opus 4: $15.00/1M токенов
Модель уже доступна для тестирования, а ее полный релиз запланирован на конец июня.