ВТБ назвал самые перспективные активы для частных инвесторов
17:15
"Ростелеком" объединяет ключевые производственные активы в холдинг "Техновейв"
16:50
Глава брокера ВТБ рассказал, каким должен быть идеальный портфель
16:25
Глава брокера ВТБ: ждём средний курс рубля на 2026 год на уровне 81 рубль за доллар
14:10
ВТБ узнал, что мотивирует россиян копить совместно
13:50
"Салют для бизнеса" и Скала^р создадут отечественный ИИ-щит для промышленности
13:40
Сбер и red_mad_robot запускают эру ИИ-нативной разработки в России
13:35
Доброволец и герой гуманитарных миссий Александр Крештоп едет в Краснодар
05:39
Делегация Молодежного совета ВКП примет участие в весенней сессии МПА СНГ
18 мая, 19:25
124 тысячи человек приняли участие в конкурсе "Цифровой марафон"
18 мая, 18:20
Герой России Олег Джафаров занял пост заместителя губернатора ЕАО
18 мая, 17:25
"Нить поколений": в Биробиджане высадили 3 тысячи кустов сирени в память о героях
18 мая, 17:05
Аналитика ВТБ: средний счет долгосрочных сбережений вырос более чем на треть
18 мая, 15:10
Генеральный секретарь ВКП примет участие в заседании Совета глав правительств СНГ
17 мая, 15:25
Виктор Пинский: "Единая Россия" - партия, которая честно говорит о проблемах
16 мая, 14:15

Сбер представляет Kandinsky 4.1 Video — качественный скачок в генерации видео по тексту

30 июня 2025, 19:55
Общество
Тематическая иллюстрация ИА PrimaMedia
Тематическая иллюстрация
Фото: ИА PrimaMedia
Нашли опечатку?
Ctrl+Enter

Сбер активно развивает свою генеративную нейросеть Kandinsky (6+) и в самое ближайшее время выпустит новую версию для генерации видео Kandinsky 4.1 Video. Первые доступы к Kandinsky 4.1 Video уже получили участники GigaConf (16+), а также некоторые художники и дизайнеры. В ближайшем будущем она будет доступна всем пользователям. Об этом заявил старший вице-президент, руководитель блока "Технологическое развитие" Сбербанка Андрей Белевцев в рамках технологической конференции GigaConf.

Андрей Белевцев, старший вице-президент, руководитель блока "Технологическое развитие" Сбербанка:

"Kandinsky 4.1 Video обеспечивает качественно новый уровень генеративного видео. Модель стала в разы лучше по всем параметрам: по соответствию промпту, визуальному качеству, качеству генерации движений, а также способности моделировать физику мира. Такие разработки открывают беспрецедентные возможности как для дизайнеров, маркетологов, так и для представителей любых других креативных индустрий, работающих над созданием высококачественного видеоконтента".

Модель Kandinsky 4.1 Video генерирует видеоряд продолжительностью до 10 секунд в разрешении SD (720x576) или HD (1280x720) по любому текстовому описанию или произвольному стартовому кадру. С помощью модели можно создавать качественные видео с произвольным соотношением сторон под любые пользовательские и продуктовые потребности.

В основе новой модели лежит продвинутая архитектура диффузионного трансформера. Одним из ключевых факторов, позволивших значительно улучшить качество модели, стало её дообучение (Supervised Fine-Tuning, SFT) на тщательно отобранных данных, подготовленных более, чем 100 экспертами — дизайнерами, фотографами и художниками с профильным образованием. Этот этап обучения позволил значительно повысить уровень художественной выразительности, композиции видео и кинематографичности визуального ряда.

Переход к новой большой архитектуре заметно увеличил потребность в вычислительных ресурсах, поэтому при разработке уделялось особое внимание оптимизации. В результате применения методов дистилляции и ускорения, время генерации видео сократилось более чем в три раза по сравнению с исходным вариантом, при этом в ряде сценариев качество генерации сохранилось или даже улучшилось.

Напомним, что первая в России модель генерации видео Kandinsky Video была представлена 22 ноября 2023 года на конференции AI Journey (18+).

Реклама. Рекламодатель: ПАО "Сбербанк". Юридический адрес: Россия, Москва, 117312, ул. Вавилова, д. 19. ОГРН 1027700132195, ИНН 7707083893.

16842
83
89