Аэрофлот проведёт традиционную акцию для ветеранов в честь 81-й годовщины Победы
20 апреля, 19:55
ВТБ: в весенние каникулы молодежь оформила в три раза больше Пушкинских карт
20 апреля, 19:00
Не зарплатой единой: молодёжь выбирает специальность из-за интереса и удалёнки
20 апреля, 15:10
"Российско-китайская история полна потрясающих сюжетов, достойных Премии имени Арсеньева"
20 апреля, 11:25
Крупное чукотское предприятие хочет через суд на Камчатке отменить заморозку счетов
20 апреля, 10:25
Профсоюзы работников здравоохранения СНГ защищают труд медиков и жизни всех граждан Содружества – Виктор Пинский
18 апреля, 20:40
На дальневосточных рейсах увеличат провозные емкости в период пикового спроса
18 апреля, 03:35
Застройщикам ИЖС улучшили условия
17 апреля, 21:20
"Когда кто-то придумывает новые препятствия для бизнеса, надо идти на СВО. Подумать - прав ли ты?"
17 апреля, 12:05
ВТБ закупит медицинское оборудование для детских больниц в 16 регионах
16 апреля, 21:40
ВТБ: в первом квартале рынок сбережений вырос почти на 500 млрд рублей
16 апреля, 20:45
Более 15 тысяч заявок поступило на национальный чемпионат творческих компетенций "АртМастерс"
16 апреля, 20:05
Улан-Удэ назвали городом дуализма при создании бренда
16 апреля, 16:30
В поисках электричества: действующим ТЭЦ повысят "пенсионный возраст"
16 апреля, 15:15
В ЕАО символ проекта "Жить за двоих" получил регистрацию в Роспатенте
16 апреля, 14:15

Ученые Сбера представили модели ИИ, способные распознавать русский жестовый язык

На базе одной из моделей были обучены нейросети для распознавания американского жестового языка
24 ноября 2023, 18:00
Общество
Нашли опечатку?
Ctrl+Enter

Сбер представил нейросетевые модели, позволяющие распознавать русский жестовый язык. Об этом на конференции AI Journey (16+) сообщил старший вице-президент, СTO, руководитель блока "Технологи" Сбербанка Андрей Белевцев.

Команда Vision RnD (из Управления экспериментальных систем машинного обучения) в SberDevices, разрабатывающая одно из таких решений, первой в мире представила прототип общения с генеративной языковой моделью при помощи жестового языка в открытом доступе. Это стало возможно благодаря использованию GigaChat API (6+), программного интерфейса доступа к сервису GigaChat. Генеративная модель GigaChat сама, без дополнительных преобразований, понимает контекст распознанных жестов. Например, распознанные отдельные слова: "Я Идти Улица Гулять" сервис сам преобразовывает в корректную фразу: "Я пошел гулять на улицу", сохраняя контекст передачи информации.

Текущая версия модели позволяет распознавать более 2500 жестов, включая понимание дактиля (произношение слов по буквам) и возможность распознавать составные жесты. Кроме того, модель понимает терминологию по темам банковской сферы, транспорта, животных, и даже несколько слов из сферы медицины и образования. Этот объем покрывает существенную часть словаря русского жестового языка, позволяя создавать сервисы с нужным прикладным применением.

На базе этой модели были обучены нейросети для распознавания американского жестового языка, которые заняли первую строчку в публичном рейтинге WLASL-2000. Достичь такого результата позволило использование одного из самых разнообразных и больших в мире датасета для распознавания русского жестового языка — Slovo. Датасет и обученная на нем модель выложены в открытый доступ.

Другая команда исследователей, из подразделения Sber AI во благо общества, разработала и опубликовала в открытом доступе легкую модель распознавания жестового языка, не требовательную к вычислительным ресурсам. Модель работает на CPU, что снижает себестоимость решений, создаваемых на ее основе. Это дает возможность широкому кругу разработчиков проектировать инклюзивное программное обеспечение, например, продукты и сервисы для коммуникации или инструменты для изучения жестового языка. На сегодняшний день алгоритм распознает 1600 жестов и преобразовывает в слова до трёх жестов в секунду на стандартных персональных компьютерах. В 2024 году планируется тестирование и внедрение модели распознавания русского жестового языка и решений на ее основе в ряде регионов России.

Андрей Белевцев, старший вице-президент, СTO, руководитель блока "Технологи" Сбербанка:

"Сервисы для распознавания русского жестового языка и созданная Сбером система искусственного интеллекта GigaChat позволят преодолеть коммуникационный разрыв и сделают мир доступнее для людей с нарушением слуха. Модели могут использоваться в рамках исследований, позволяющих развивать сервисы для пользователей с инвалидностью. Например, для создания доступной среды в многофункциональных центрах (МФЦ), в транспортной отрасли (аэропорты, вокзалы, метро), в больницах для общения пациента и врача, в банковских сервисах и адаптации онлайн и оффлайн-образования".

16842
83
89