Ученые при помощи AI для определяют отстающих студентов

Ученые из Университета Западной Вирджинии и Политехнического университета штата Калифорния рассматривают возможность использования алгоритмов машинного обучения для определения отстающих студентов на занятиях по физике.

Курсы по физике и другим фундаментальным научным дисциплинам вызывают в начале обучения трудности у некоторых студентов. В итоге 40% учащихся, поступающих на инженерные и научные специальности, переключаются на другие предметы, специальности и не получают первоначальной степени.

Чтобы обучить алгоритмы AI прогнозированию успеваемости студентов, ученые собрали данные о вводных занятиях по физике из двух крупных институтов. В первую и вторую группу вошли студенты-физики и инженеры из колледжа (7 184 и 1 683 соответственно). Третью часть данных предоставило учебное заведение со студентами преимущественно латиноамериканского происхождения.

Первый датасет охватывал период обучения 2000–2018 гг. и 2016–2019 гг., преимущественно со светлокожими студентами (80%). Третий датасет охватывал 2017 год и данные о студентах латиноамериканского (46%) и азиатского (21%) происхождения.

Ученые обучили алгоритм на основе метода Random forest для получения прогноза об итоговых оценках по физике ( A, B, C, D, F; W отчислен или сменил направление обучения).

Алгоритм по первой выборке определил долю студентов с оценками в диапазоне DFW в 16%. Решение определило улучшение производительности студентов на 3% на первой неделе, 6% на второй неделе, 9% на пятой неделе и 18% на восьмой неделе обучения на курсах по физике.

В одном из примеров алгоритмы «случайного леса» правильно распознали только 16% учащихся с оценками «DFW». Однако 57% его прогнозов оказались верными. Это не обязательно указывает на то, что модель плоха. Относительно третьей выборки ИИ-алгоритм продемонстрировал меньшую точность в прогнозировании по сравнению с первым и вторым датасетом. Разные подходы ученых дали разные результаты.

По их словам, эффективность моделей, предсказывающих результаты демографических подгрупп оказались приблизительно равны общим показателям. Для повышения производительности модели ученые продолжат работу с институциональными исследованиями, чтобы обеспечить алгоритмы машинного обучения как можно большим набором данных.