SWE-1: новая линейка моделей для разработки ПО от Windsurf
Windsurf представила семейство моделей SWE-1, предназначенных для поддержки широкого спектра задач в области разработки программного обеспечения. В линейку вошли три модели: SWE-1, SWE-1-lite и SWE-1-mini, каждая из которых ориентирована на конкретные сценарии использования.
SWE-1 сосредоточена на инструментальном анализе и демонстрирует производительность, сравнимую с Claude 3.5 Sonnet, при этом будучи более экономичной в эксплуатации. SWE-1-lite, заменившая предыдущую модель Cascade Base, предлагает улучшенное качество и доступна всем пользователям без ограничений. SWE-1-mini — это компактная модель с высокой скоростью обработки, которая позволяет использовать функции пассивного прогнозирования в среде Windsurf Tab.
Модели SWE разработаны для устранения ограничений существующих решений в области генерации кода. Они используют концепцию ‘flow awareness’, которая позволяет моделям анализировать длительные, многоэтапные задачи разработки с неполными или изменяющимися состояниями. Обучение моделей проводилось на основе взаимодействий пользователей в редакторе Windsurf, с учетом контекста из терминалов, браузеров и обратной связи.
Производительность SWE-1 оценивалась с помощью оффлайн-тестов и слепых экспериментов в реальных условиях. Тесты включали задачи по завершению частично выполненных сессий разработки и достижению инженерных целей. В обоих случаях SWE-1 показала результаты, близкие к ведущим моделям, и превзошла альтернативы с открытыми весами и среднего уровня.
Эксперименты в реальных условиях подтвердили, что SWE-1 активно используется разработчиками, о чем свидетельствуют такие метрики, как количество строк кода, принятых пользователями, и частота внесения изменений. SWE-1-lite и SWE-1-mini были разработаны с использованием аналогичных подходов, но с акцентом на средний уровень производительности и задачи с низкой задержкой соответственно.
Все модели построены вокруг концепции ‘shared timeline’, которая позволяет пользователям и ИИ работать вместе в рамках единого процесса. Windsurf планирует расширять этот подход и совершенствовать семейство SWE, используя данные, собранные через свою интегрированную среду разработки.
Сообщество разработчиков уже отметило потенциал SWE-1 в решении задач, выходящих за рамки генерации кода. Особое внимание привлекла способность модели анализировать инструменты и работать с неполными рабочими процессами в различных средах разработки.
Релиз моделей SWE-1 совпал с приобретением Windsurf компанией OpenAI, что должно укрепить позиции последней на рынке ИИ-инструментов для разработки программного обеспечения. OpenAI планирует интегрировать технологии Windsurf в свои продукты, такие как ChatGPT и Codex, чтобы расширить свои возможности в этой области.