Google анонсирует предварительную версию Veo, свою модель генерации видео на базе искусственного интеллекта

Еще в мае Google впервые представила Veo, свою первую модель ИИ
видеогенерации. Новая модель Veo может генерировать видео с разрешением
1080p в широком диапазоне кинематографических и визуальных стилей. Google
также заявили, что Veo может точно понимать тон текстовой подсказки и
отображать детали даже в длинных подсказках.
Сегодня Google анонсировала закрытую предварительную версию Veo для
клиентов Vertex AI. Используя Veo на Vertex AI, клиенты могут генерировать видео
из простых текстовых или графических подсказок, что позволяет им быстро
создавать прототипы и итерации видео контента. Благодаря этому Google Cloud
становится первым гиперскейлером, предлагающим модель «изображение —
видео» для внешних клиентов.
Наряду с закрытым предварительным просмотром Veo, Google также объявила о
выпуске в открытый доступ Imagen 3, последней модели преобразования текста в
изображение. Google утверждает, что Imagen 3 может генерировать изображения с
высокой степенью детализации, которые являются фотореалистичными и содержат
меньше отвлекающих визуальных артефактов по сравнению с Imagen 2.
Модель преобразования текста в изображение Imagen 3 будет доступна на
следующей неделе на Vertex AI для клиентов Google Cloud. Google также
представляет следующие функции, которые позволят клиентам Imagen 3
дополнительно настраивать изображения, сгенерированные ИИ.
Редактирование Imagen 3 предлагает простой способ улучшения и адаптации
изображений с помощью текстовых подсказок. Он также позволит пользователям
редактировать только части изображения, например, обновлять фоны продуктов и
многое другое.
Настройка Imagen 3 позволит клиентам управлять моделью для создания
изображений на основе определенных характеристик. Клиенты могут заставить
Imagen 3 использовать свой собственный бренд, стиль, логотип, тему или
характеристики продукта при создании новых изображений.
Google подчеркнул, что и Veo, и Imagen 3 оснащены функциями безопасности. Обе
модели предотвращают создание вредоносного контента и придерживаются
принципов ответственного ИИ. Кроме того, невидимые водяные знаки SynthID
встроены в каждое изображение и кадр, которые создают Imagen 3 и Veo.
С запуском Veo и Imagen 3 Google Cloud зарекомендовал себя как лидер в области
создания контента на базе искусственного интеллекта среди гиперскейлеров.