Аннотация:Магистерская диссертация Каюмова Эмиля Марселевича посвящена одной из самых динамично развивающихся областей машинного обучения – «обучению с подкреплением». В качестве базовой задачи для исследования выбрана известная головоломка «кубик Рубика», цель – научить компьютер собирать головоломку (при этом он может лишь совершать некоторые действия с ней и получать отклик о состоянии сборки, в самом простейшем случае: «собрал» или «не собрал»).
Диссертация состоит из введения (описываются достижения обучения с подкреплением и выбранная тема исследований), раздела «Постановка задачи» (описывается постановка задачи обучения с подкреплением), раздела «Подходы» (описываются подходы, как к решению задачи сборки кубика Рубика, так и к решению задачи обучения с подкреплением), раздела «Эксперименты» (приводятся описания используемых моделей, постановка экспериментов, результаты и выводы), заключения и списка литературы.
В итоге магистр рассмотрел разные подходы к сборке кубика Рубика средствами обучения с подкреплением, предложил метод обучения нейросетевой Q-функции, предложил и экспериментально обосновал несколько мета-алгоритмов.
К недостаткам работы можно отнести то, что на последнем курсе она велась недостаточно интенсивно, поэтому сильно пересекается с курсовой прошлого года. По полученным результатам нет публикации.