|
Архив публикацийТезисыXXI-ая конференцияПредсказания в задаче студент/вопрос при помощи метода стохастического градиентного спускаВятский государственный университет, ф-т экономики и менеджмента, кафедра ММЭ, Россия, 610000, г.Киров, ул.Московская, д.36, 1 стр. (принято к публикации)Вычислительная статистика (или анализ данных) является сравнительно новой научной областью. Важность вычислительной статистики обусловлена огромными массивами данных, которые порождаются высокими технологиями. В настоящее время вычислительная статистика является одной из наиболее динамичных и перспективных научных направлений. Успешные результаты в области вычислительной статистики базируются на глубоком понимании статистических закономерностей и на свободном владении языками научного программирования. Рекомендательные системы являются важным научным направлением в рамках анализа данных. Целью рекомендательных систем является предсказание предпочтений клиентов относительно определённой группы товаров или услуг. Такие системы имеют очень большое значение применительно к спорту, маркетингу и образованию. В последнем случае мы заинтересованы улучшить систему оценивания студентов, посредством предсказания насколько успешно студент справится с поставленной задачей. Этот прогноз поможет студентам выбрать правильные ориентацию и направление для последующего обучения. Следует отметить, что исторические данные даны в форме списка, но не в традиционной форме матрицы. По этой причине, стандартные факторизационные методы не применимы в этом случае. Однако методы стохастического градиентного спуска [1] проявили себя очень эффективными при работе со списками данных, когда подавляющее большинство отношений отсутствует и может быть востребовано в качестве прогноза. В настоящей статье мы рассматриваем оптимизацию наиболее важных составных параметров, таких как количество факторов, обучающие и регулирующие параметры, количества глобальных итераций. Наши эксперименты опираются на данные Grockit, которые использовались в 2012 году при проведении популярного соревнования на платформе Kaggle. Отметим, что Grockit это наиболее быстро растущая в мире система, доступная посредством интернета, для студентов, которые заинтересованы улучшить свою подготовку к разнообразным экзаменам и тестам.
Литература 1. Никулин В.Н. О разложении матриц при помощи метода стохастического градиентного спуска в приложении к задаче направляемой классификации микрочипов // Компьютерные Исследования и Моделирование, том 5(2), год 2013. Cтр. 131-141. |