Google Veo 3: создание видео с музыкой из текста
Google представила Veo 3 — модель для генерации видео на основе текста. В отличие от предыдущих версий, она умеет добавлять диалоги, голосовые озвучки и звуковые эффекты. Разработка принадлежит DeepMind, подразделению Google, и позиционируется как более точный инструмент для создания контента.
Модель генерирует видео с учетом детализированных текстовых описаний. Например, запрос «бумажный кораблик плывет по наполненному дождем желобу» превращается в реалистичный ролик с плавным движением воды и наклоном лодки. Качество изображения стало четче, а движения — естественнее, что усложняет распознавание AI-контента.
Дополнительные функции:
- Фоновые шумы и музыка
- Контроль над движением камеры
- Расширение существующих видео
- Создание переходов между сценами
Потенциальные риски
С улучшением качества растет риск использования технологии для дезинформации. Пока AI-видео можно отличить по неестественной мимике, задержке звука и «размытому» фону, но с каждым обновлением эти признаки становятся менее заметными.
Flow — приложение для AI-фильммейкинга
Google также выпустила Flow — инструмент для редактирования AI-видео. В нем можно настраивать ракурсы, длину сцен и добавлять спецэффекты. Пока полный доступ ко всем функциям Veo 3 и Flow есть только у подписчиков Google AI Ultra за $125 в месяц.
Технология развивается быстро, и вскоре граница между реальными и сгенерированными видео может стать еще тоньше. Пока OpenAI не добавила звук в свою модель Sora, Google держит лидерство в этой гонке.