Контент сгенерированный ИИ, в последнее время становится все более популярным. Не так давно OpenAI выпустила Sora, модель преобразования текста в видео, предназначенную для создания коротких высококачественных клипов, оживляющих слова таким образом, что они кажутся почти реальными. Загвоздка в том, что он ограничен 20 секундами и выдает HD-контент с разрешением 1080p.
Перенесемся в сегодняшний день, и DeepMind от Google не отстает, с запуском Veo 2 они усиливают конкуренцию своего преемника, — Veo 1. По словам DeepMind: Veo 2 может создавать полноценные видео в 4K, которые могут длиться до 2 минут.
Один из примеров, опубликованных на их сайте, — это видео, созданное из подробнейшего задания. Задание описывает медленный кадр с тележки дворца эпохи Возрождения, с бархатными шторами, инкрустированной золотом мебелью, люстрами, излучающими мягкий свет, и стоической королевой, сидящей за столом. На столе лежит письмо, на заднем плане бормочут придворные, и каждая деталь в комнате кажется тяжелой из-за тяжести предательства:
Вот фактическое описание для генерации видео, использованное в примере:
Камера движется в медленном кадре с тележки, показывая роскошь ренессансного дворца, украшенного инкрустированной золотом мебелью, бархатными шторами и люстрами, отбрасывающими мягкий мерцающий свет. Королева неподвижно сидит за позолоченным столом, ее темно-красное шелковое платье каскадом падает на пол, как пролитая кровь. На столе лежит неподписанное письмо, его края загнуты от времени. Камера снимает ее сзади, улавливая отражение ее стоического лица в огромном, богато украшенном зеркале. На заднем плане придворные бормочут, их силуэты танцуют, как призраки в свете свечей. Комната кажется тяжелой, каждая позолоченная деталь усиливает атмосферу предательства и паранойи. Цветовая палитра чередуется между глубокими, королевскими красными и холодными золотыми тонами, а светотеневое освещение усиливает драматизм. Снято на 70-миллиметровую пленку для богатой текстуры, вызывая величие исторических шедевров.
Но не будем слишком увлекаться. Хоть этот пример и ошеломляет, стоит отметить, что DeepMind, скорее всего, отобрали их вручную, чтобы показать лучшее из того, что сделал Veo 2. Не все идеально. Одно из ограничений, на которое они указали, заключается в том, что генерация сложных сцен или движения все еще может быть проблематична.