ВТБ узнал, что мотивирует россиян копить совместно
13:50
"Салют для бизнеса" и Скала^р создадут отечественный ИИ-щит для промышленности
13:40
Сбер и red_mad_robot запускают эру ИИ-нативной разработки в России
13:35
Доброволец и герой гуманитарных миссий Александр Крештоп едет в Краснодар
05:39
Делегация Молодежного совета ВКП примет участие в весенней сессии МПА СНГ
18 мая, 19:25
124 тысячи человек приняли участие в конкурсе "Цифровой марафон"
18 мая, 18:20
Герой России Олег Джафаров занял пост заместителя губернатора ЕАО
18 мая, 17:25
"Нить поколений": в Биробиджане высадили 3 тысячи кустов сирени в память о героях
18 мая, 17:05
Аналитика ВТБ: средний счет долгосрочных сбережений вырос более чем на треть
18 мая, 15:10
Генеральный секретарь ВКП примет участие в заседании Совета глав правительств СНГ
17 мая, 15:25
Виктор Пинский: "Единая Россия" - партия, которая честно говорит о проблемах
16 мая, 14:15
В Магадане оглашен приговор жительнице Чукотки за убийство и кражу
15 мая, 18:40
Великое членистоногое переселение: как Баренцево море заселили камчатским крабом
15 мая, 17:45
Вертолет Ми-8 совершил жесткую посадку в Амурском районе
15 мая, 17:25
ВТБ удвоил кредитный портфель туристических проектов среднего и малого бизнеса
15 мая, 15:05

ГигаЧат успешно сдал экзамен по математике и компьютерным наукам

19 марта, 15:25
Общество
Тематическая иллюстрация ИА PrimaMedia.ru
Тематическая иллюстрация
Фото: ИА PrimaMedia.ru
Нашли опечатку?
Ctrl+Enter

Нейросеть Сбера ГигаЧат (18+) подтвердила уровень знаний, достаточный для успешной сдачи экзамена по направлению "Математика и компьютерные науки" на уровне выпускника магистратуры. В ходе аттестационного испытания, проведенного на базе Сколтеха, работа модели была оценена аттестационной комиссией на оценку 4 ("хорошо"), сообщает пресс-служба Сбера.

Аттестация проходила в два этапа. Сначала модель прошла тестирование на 500 уникальных вопросах закрытого типа в формате MMLU, которые были разработаны преподавателями Сколтеха. Они охватывали девять тем в области компьютерных наук: алгоритмы и структуры данных, базы данных, кибербезопасность, программное обеспечение, программирование, сети и оборудование, специализированное ПО, управление и искусственный интеллект. Средний показатель правильных ответов модели на вопросы составил 76,9%.

Второй этап — очный экзамен с участием аттестационной комиссии, состоящей из 8 докторов технических и физико-математических наук. Эксперты комиссии выбрали 3 билета из 45, по которым проводили оценку знаний ГигаЧат. Каждый билет содержал два задания — теоретическое (проверка фундаментальных знаний в предметной области) и практическое (прикладная задача). Все задачи были разработаны специально для этого испытания и отсутствовали в открытых базах, что исключало возможность поиска готовых ответов и требовало от нейросети применения реальных знаний. Для объективной оценки глубины компетенций эксперты не только проверяли ответы, но и задавали уточняющие вопросы, просили объяснить ход рассуждений и анализировали работу модели с нестандартными формулировками.

Оценка проводилась по профильному принципу: например, при оценке ответов модели на задания по программированию решающий голос принадлежал соответствующему эксперту. Применение весовых коэффициентов позволило обеспечить максимальную объективность аттестации. По итогам очного экзамена модель набрала 7 из 10 баллов по шкале Сколтеха, что соответствует итоговой оценке 4 ("хорошо").

Ранее ГигаЧат успешно сдал ЕГЭ по обществознанию, профильные экзамены по медицине, финансам, экономике, музыковедению и другим направлениям в ведущих вузах страны.

16842
83
89