Дата в истории ЕАО: учреждено Приамурское генерал-губернаторство
08:00
ЕАО возглавила список лидеров роста в рейтинге социально-экономического положения регионов
12:00
В скейт-парке Биробиджана монтируют дополнительную линию освещения
11:30
В Биробиджане прошли праздники по случаю Дня соседа
11:00
250 млн рублей потратят на ремонт Технологического техникума в Биробиджане
10:30
Виртуальный ухажер с сайта знакомств развел жительницу ЕАО более чем на 1,5 млн рублей 
10:00
Подразделение ДРСК в ЕАО стало серебряным призёром областного конкурса по охране труда
09:51
Землю дали, про дорогу забыли: подъезд к участку жителя ЕАО обустроят по решению суда
09:30
Экспертный совет "Единой России" представил предложения в новую Народную программу, в том числе из ЕАО
15 июня, 18:30
Мошенники начали обманывать граждан под видом записи в налоговую инспекцию
15 июня, 16:30
С 1 июля семейную ипотеку планируют привязать к числу детей в семье
15 июня, 16:00
Отследит взгляд, пульс и зевоту: как работает новый стандарт контроля усталости водителя
15 июня, 16:00
Нашествие ядовитой рыбы фугу у берегов Приморья объяснили ученые
15 июня, 15:30
Как изменятся цены на обучение в автошколах после введения рейтинга
15 июня, 15:00
В автошколах могут ввести экзамен по первой помощи пострадавшим в ДТП
15 июня, 14:30
Россиян не будут штрафовать за авторизацию через зарубежные сервисы
15 июня, 14:00

ГигаЧат успешно сдал экзамен по математике и компьютерным наукам

19 марта, 13:25
Общество
Тематическая иллюстрация ИА PrimaMedia.ru
Тематическая иллюстрация
Фото: ИА PrimaMedia.ru
Нашли опечатку?
Ctrl+Enter

Нейросеть Сбера ГигаЧат (18+) подтвердила уровень знаний, достаточный для успешной сдачи экзамена по направлению "Математика и компьютерные науки" на уровне выпускника магистратуры. В ходе аттестационного испытания, проведенного на базе Сколтеха, работа модели была оценена аттестационной комиссией на оценку 4 ("хорошо"), сообщает пресс-служба Сбера.

Аттестация проходила в два этапа. Сначала модель прошла тестирование на 500 уникальных вопросах закрытого типа в формате MMLU, которые были разработаны преподавателями Сколтеха. Они охватывали девять тем в области компьютерных наук: алгоритмы и структуры данных, базы данных, кибербезопасность, программное обеспечение, программирование, сети и оборудование, специализированное ПО, управление и искусственный интеллект. Средний показатель правильных ответов модели на вопросы составил 76,9%.

Второй этап — очный экзамен с участием аттестационной комиссии, состоящей из 8 докторов технических и физико-математических наук. Эксперты комиссии выбрали 3 билета из 45, по которым проводили оценку знаний ГигаЧат. Каждый билет содержал два задания — теоретическое (проверка фундаментальных знаний в предметной области) и практическое (прикладная задача). Все задачи были разработаны специально для этого испытания и отсутствовали в открытых базах, что исключало возможность поиска готовых ответов и требовало от нейросети применения реальных знаний. Для объективной оценки глубины компетенций эксперты не только проверяли ответы, но и задавали уточняющие вопросы, просили объяснить ход рассуждений и анализировали работу модели с нестандартными формулировками.

Оценка проводилась по профильному принципу: например, при оценке ответов модели на задания по программированию решающий голос принадлежал соответствующему эксперту. Применение весовых коэффициентов позволило обеспечить максимальную объективность аттестации. По итогам очного экзамена модель набрала 7 из 10 баллов по шкале Сколтеха, что соответствует итоговой оценке 4 ("хорошо").

Ранее ГигаЧат успешно сдал ЕГЭ по обществознанию, профильные экзамены по медицине, финансам, экономике, музыковедению и другим направлениям в ведущих вузах страны.

16842
11
36