ИСТИНА |
Войти в систему Регистрация |
|
ФНКЦ РР |
||
Диссертационная работа посвящена разработке нового математического аппарата для получения точных оценок надёжности обучения по прецедентам. Предложен комбинаторный подход, позволяющий учитывать структуру расслоения и связности используемых семейств алгоритмов. 1. Наиболее существенные результаты диссертации, полученные лично соискателем: — предложен общий подход к получению точных комбинаторных оценок надёжности эмпирических предсказаний, основанный на единственном вероятностном допущении, что наблюдения в конечной выборке данных независимы (стр. 16–88); — разработан метод эмпирического измерения факторов завышенности оценок вероятности переобучения; выявлена ключевая роль эффектов расслоения и связности в семействах алгоритмов для снижения вероятности переобучения (стр. 140–167); — предложены общие методы получения точных оценок вероятности переобучения: метод порождающих и запрещающих множеств (стр. 171–178, 192–203), рекуррентный метод (стр. 205–217), блочный метод (стр. 178–182), интервальный метод (стр. 183–192); — получены точные оценки вероятности переобучения для ряда модельных семейств алгоритмов: пары алгоритмов, слоя, интервала и нижних слоёв интервала булева куба, монотонных и унимодальных цепочек, единичной окрестности (стр. 180–204); — получена достаточно точная верхняя оценка вероятности переобучения, выраженная через профиль расслоения и связности (стр. 211–217); — получена точная оценка полного скользящего контроля (CCV) для метода ближайшего соседа, выраженная через профиль компактности выборки (стр. 221–229); — получена слабо завышенная верхняя оценка CCV для семейства монотонных классификаторов, выраженная через профиль монотонности выборки (стр. 230–235).