Нейросеть «Kandinsky 2.2» научилась создавать анимацию по текстовому описанию
До конца года разработчики обещают даст доступ к этой опции всем пользователям
«У пользователей нейросети «Kandinsky 2.2» появилась возможность создавать видеоролики по текстовому описанию в режиме анимации, по одному текстовому описанию генерируется четырехсекундное видео c выбранным эффектом анимации, с частотой 24 кадра в секунду и разрешением 640x640 пикселей», — рассказали в пресс-службе Сбера.
Синтез одной секунды видео в среднем занимает около 20 секунд.
«Генерация анимационных видеороликов работает в тестовом режиме и доступна самым активным пользователям, которые получат приглашение в ближайшее время, до конца года оценить новые возможности нейросети смогут абсолютно все», — отметили в пресс-службе.
Для того чтобы сгенерировать видео в режиме анимации, нужно описать текстом то, что хочется увидеть, далее бот предложит на выбор 16 вариантов анимации сцены, а после этого нейросеть сгенерирует анимированный видеоролик. Также доступна генерация составных сцен: пользователь может ввести до трех текстовых описаний, затем выбрать для каждого свою механику анимации, а после этого модель создаст мини-фильм.
«С момента выхода модели «Kandinsky 2.2» пользователи уже сгенерировали более 50 млн изображений, — сообщил первый заместитель председателя правления банка Александр Ведяхин. — Теперь у них появилось еще больше возможностей для творчества совершенно бесплатно, сегодняшний запуск видео-функции в режиме анимации — это важный шаг в развитии нашей нейросети и для всей глобальной индустрии мультимодальных моделей искусственного интеллекта».
Иллюстрация сделана с помощью нейросети «Kandinsky 2.2»