Состав жюри восьмого сезона Премии им. Арсеньева объявили 1 июля в Москве
1 июля, 20:45
Более 30 трупов, кости и зловоние: адом и пыточной стал для собак дом заводчицы из ЕАО
1 июля, 19:50
Виктор Пинский принял участие в заседании совета Всеобщей конфедерации профсоюзов
1 июля, 19:00
Опрос ВТБ: страх "не угадать" мешает росту популярности подписок в качестве подарка
1 июля, 18:25
Владимир Касютин: Медиа, которые занимаются проблемами людей, будут востребованы
1 июля, 17:40
Виктор Пинский встретился с депутатами парламента Таджикистана
1 июля, 17:40
ВТБ представил основные направления стратегии на 2027–2029 годы
1 июля, 17:30
А7А5: Российскому крипторынку важно найти баланс между контролем и развитием инноваций
1 июля, 01:24
СберСтрахование назвала регионы, где припаркованные автомобили чаще всего повреждаются
30 июня, 20:40
ИИнвестиции: каждый пятый россиянин уже использует искусственный интеллект в финансовых вопросах
30 июня, 20:10
Мотивация и "быстрое касание" — то, что нужно начинающему предпринимателю на старте
30 июня, 17:15
Практическое применение технологии Physical AI в ретейле
30 июня, 17:10
Коллаборации и переобучение укрепляют малый бизнес в условиях неопределённости
30 июня, 17:00
СберИнвестиции: у подростков-инвесторов растет интерес к облигациям
30 июня, 15:50
GenAI и роботизация могут дать российской экономике до 33% роста производительности труда
30 июня, 15:40

Высокое искусство вашими руками. Сбер представил новую версию нейросети Kandinsky 3.0

Модель ещё лучше понимает текстовые запросы и за несколько секунд создаёт реалистичные изображения, в том числе на тему культуры России
23 ноября 2023, 13:20
Общество
Тематическая иллюстрация Kandinsky 3.0
Тематическая иллюстрация
Фото: Kandinsky 3.0
Нашли опечатку?
Ctrl+Enter

Сбер создал новую версию генеративной модели для творчества — Kandinsky 3.0 (6+). Усовершенствованная нейросеть представлена на конференции Сбера по искусственному интеллекту и машинному обучению AI Journey (16+), которая проходит с 22 по 24 ноября.

Новая версия в сравнении с предыдущими лучше понимает текстовый запрос пользователя. Нейросеть теперь умеет создавать ещё более фотореалистичные изображения, генерировать полноценные художественные картины и арты со скетчами. Модель работает с запросами из широкого списка тем и способна реализовать любой полёт фантазии.

Kandinsky 3.0 лучше предыдущих версий знает элементы отечественного культурного кода. Так, значительно улучшилось качество генерации российских и советских известных личностей и персонажей, архитектурных достопримечательностей, объектов культуры и элементов народного искусства России, например гжельской росписи. Кроме того, у новой модели усовершенствована функция редактирования изображений и возможность их дорисовки в режиме бесконечного полотна (inpainting и outpainting).

Kandinsky 3.0 создаёт изображения с высоким разрешением — 1024 х 1024 пикселей, — при этом может синтезировать картинки с выбранным соотношением сторон. Для обучения нейросети разработчики использовали обновлённый датасет в размере 1,5 млрд пар "текст — изображение", содержащий данные, которые прошли многоэтапные процедуры фильтрации, что в итоге привело к заметному повышению качества генераций.

1 / 3

Александр Ведяхин, первый заместитель Председателя Правления Сбербанка:

"Технологии искусственного интеллекта могут наделить человека супервозможностями. Kandinsky — один из инструментов, предоставляющих такие возможности. Это удобная, функциональная и бесплатная нейросеть Сбера для творчества. Мы постоянно работаем над её усовершенствованием. Новая версия модели ещё лучше понимает запросы от пользователей, научилась разбираться в тонкостях русской культуры и народного творчества. Пробуйте, творите, создавайте уникальные художественные произведения, которые могут стать подарком или украсят вашу коллекцию".

Пользователи нейросети Kandinsky 3.0 также могут создавать видеоролики по текстовому описанию в режиме анимации. По одному запросу генерируется видео длиной в четыре секунды c выбранным эффектом анимации, с частотой 24 кадра в секунду и разрешением 640 x 640 пикселей. Синтез одной секунды видео в среднем занимает около 20 секунд. Для расширения возможностей базовой модели были реализованы разные виды анимации изображений, что позволило перемещать объекты, приближать и отдалять их, оживлять статику всеми возможными способами. В основе режимов анимации лежит функция перерисовки изображения по текстовому описанию (image2image).

Kandinsky 3.0 понимает запросы более чем на 100 языках, а пользователи могут создавать изображения в неограниченном количестве стилей. Модель разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices (18+).

Оценить возможности нейросети можно на платформе fusionbrain.ai (18+), в Telegram (18+)— и в VK-ботах (12+), на сайте rudalle.ru. Модель работает в сервисе GigaChat (6+), доступна в мобильных приложениях СберБанк Онлайн (6+) и Салют (6+), а также на умных устройствах Sber по голосовой команде "Запусти художника". Сгенерировать анимационные видеоролики можно в Telegram-боте (18+) — для этого нужно оставить заявку на доступ.

16842
83
89