Аннотация:В настоящее время машинное обучение начинает применятся всё в большем ко
личестве задач, связанных с обработкой данных, заменяя традиционные алгоритмы
благодаря большей точности. Теперь инженер, рещающий прикладную задачу, вместо
написания детерминированного алгоритма, может собрать и разметить набор данных,
загрузить это в один из алгоритмов машинного обучения и получить модель, не усту
пающую по качеству классическому алгоритму, затратив при этом гораздо меньше уси
лий.
В 2012 году после победы нейросетевого подхода в соревновании по распознованию
изображений ImageNet Large Scale Visual Recognition Challenge-2012 часто именно ней
ронные сети стали использоваться как этот "один из алгоритмов машинного обучения".
В частности они нашли широкое применение в задачах обработки текстов и изображе
ний. Но в отличии от классических линейных и логистических моделей нейронные сети
для получения предсказания производят над входящими данными настолько большое
количество умножений и сложений с использованием предобученных коэффициентов а
также нелинейных преобразований, что человек не в состоянии осознать, каким именно
образом конкретный набор данных получил именно такое предсказание.
Данная проблема встаёт особенно остро в ситуациях, когда от решения алгорит
ма зависит человеческая жизнь. Например в определении заболевания по симптомам и
обработке рентгеновских снимков в медицине само по себе предсказание мало поможет
врачу, но при наличии развернутого ответа «почему?» специалист получит куда больше
ценной информации. Или же в самоездящих автомобилях при попадании в нештатную
ситуацию нам необходимо точно понимать, как поведёт себя машина. Это не исчерпыва
ющий список примеров, потому что понимание человеком, как работает его программа
необходимо во всех областях применения. Именно решению проблемы интерпретируе
мости нейронных сетей и посвящена эта работа.
В рамках данной работы будут рассмотрены подходы к интерпретации нейронных
сетей, основанные на обучении изначально интерпретируемых моделей на результатах
работы нейронной сети (Local Interpretable Model-agnostic Explanations[2]), анализе ак
тиваций конкретных нейронов одного из слоёв сверточной нейронной сети (Network
dissection[4]) и анализе градиентов (Deep Taylor decomposition[5]). Данные методы бу
дут рассмотрены на сети AlexNet[1] (победителе ILSVRC2012) на наборе данных из 2000
изображений. Интерпретируемость результатов работы алгоритмов будет проверена с
помощью разметки реальными людьми с использованием сервиса Яндекс.Толока.