Сбер выпустил новую модель генерации видео Kandinsky 4.1 Video, которая в настоящий момент доступна участникам GigaConf, а также некоторым художникам и дизайнерам. Уже в ближайшее время она станет доступна всем пользователям сети.
Новая ИИ-модель Kandinsky 4.1 Video стала лучше во всех отношениях: результаты ее работы точнее соответствует промптам, качество видео улучшилось, качество генерации движений повысилось, а также выросли способности моделировать физику мира. Это открывает новые возможности для дизайнеров, маркетологов и других представителей творческих профессий, занимающихся созданием высококачественного контента.
Kandinsky 4.1 Video способна генерировать видеоролики продолжительностью до 10 секунд в разрешении SD (720×576) или HD (1280×720), используя текстовые запросы пользователя или стартовое изображение. Новая ИИ-модель позволяет создавать видео с произвольным соотношением сторон под любые потребности творчества и бизнеса.
Разработчики использовали в новой модели продвинутую архитектуру диффузионного трансформера, дообученную на тщательно отобранных данных, подготовленных вручную более 100 экспертами (художниками с профильным образованием, фотографами и дизайнерами). Дообучение позволило значительно повысить уровень художественной выразительности, кинематографичности визуального ряда и композиции видео.