Опрос ВТБ: страх "не угадать" мешает росту популярности подписок в качестве подарка
18:25
Владимир Касютин: Медиа, которые занимаются проблемами людей, будут востребованы
17:40
Виктор Пинский встретился с депутатами парламента Таджикистана
17:40
ВТБ представил основные направления стратегии на 2027–2029 годы
17:30
А7А5: Российскому крипторынку важно найти баланс между контролем и развитием инноваций
01:24
СберСтрахование назвала регионы, где припаркованные автомобили чаще всего повреждаются
30 июня, 20:40
ИИнвестиции: каждый пятый россиянин уже использует искусственный интеллект в финансовых вопросах
30 июня, 20:10
Мотивация и "быстрое касание" — то, что нужно начинающему предпринимателю на старте
30 июня, 17:15
Практическое применение технологии Physical AI в ретейле
30 июня, 17:10
Коллаборации и переобучение укрепляют малый бизнес в условиях неопределённости
30 июня, 17:00
СберИнвестиции: у подростков-инвесторов растет интерес к облигациям
30 июня, 15:50
GenAI и роботизация могут дать российской экономике до 33% роста производительности труда
30 июня, 15:40
Полный состав жюри Премии им. Арсеньева объявят уже завтра, 1 июля
30 июня, 15:15
Виктор Пинский встретился с замминистром труда Таджикистана
30 июня, 14:25
100 лет блестящих достижений, уверенное продвижение к новым свершениям
30 июня, 10:00

Пользователи сгенерировали более 1,3 млн изображений за два дня с помощью Kandinsky 2.1

Среди наиболее популярных запросов лидируют: "кот", "любовь" и "космос"
7 апреля 2023, 15:45
Общество
Котик пресс-служба Сбербанка
Котик
Фото: пресс-служба Сбербанка
Нашли опечатку?
Ctrl+Enter

После выхода новой версии генеративной модели Сбера Kandinsky 2.1 (18+) пользователи всего за 48 часов сгенерировали свыше 1,3 млн изображений. Среди наиболее популярных запросов лидируют: "кот", "любовь" и "космос".

Напомним, что Сбер представил новую версию генеративной модели 4 апреля. Kandinsky 2.1 может сгенерировать изображения по их текстовому описанию на естественном языке за несколько секунд. Пользователь может создавать картины более чем в 10 стилях, включая "Киберпанк", "Аниме", "Малевич" и другие. Kandinsky 2.1 знает 101 язык и может дорисовывать части изображения, смешивать несколько рисунков, создавать картину в режиме бесконечного полотна.

Протестировать нейросеть можно в Telegram-боте (18+), на промостранице модели, на fusionbrain.ai (18+) и на платформе ML Space (18+) в хабе предобученных моделей и датасетов DataHub (18+). Также оценить возможности Kandinsky 2.1 можно в мобильном приложении Салют (6+) и на умных устройствах Sber при помощи команды "Запусти художника".

Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

Модель Kandinsky 2.1 обучена почти на 1,2 млрд пар "текст — изображение", а также на отдельно собранном датасете из 2 млн пар высококачественных изображений. Он содержит картинки с описаниями текстов и лиц людей в областях традиционно сложных для нейросетей.

Высокое качество генерации обеспечивается за счёт прогрессивной архитектуры нейросети: у Kandinsky 2.1 новая, обученная специалистами Sber AI совместно с командой SberDevices модель автоэнкодера, используемая в основном для декодирования векторных представлений изображений, что позволяет создавать изображения в высоком разрешении. Kandinsky 2.1 включает 3,3 млрд параметров вместо 2 млрд в предыдущей версии.

16842
83
89