Сколтех — новый технологический университет, созданный в 2011 году в Москве командой российских и зарубежных профессоров с мировым именем. Здесь преподают действующие ученые, студентам дана свобода в выборе дисциплин, обучение включает работу над собственным исследовательским проектом, стажировку в индустрии, предпринимательскую подготовку и постоянное нахождение в международной среде.

Скажи мне, кто твой друг: нейронные сети используют данные о банковских транзакциях для кредитного скоринга

Исследователи из Сколтеха совместно с одним из крупных европейских банков разработали нейронную сеть, которая превосходит самые современные решения в области использования данных о банковских транзакциях для оценки кредитоспособности клиентов. Результаты исследования опубликованы в трудах Международной конференции IEEE International Conference on Data Mining (ICDM) 2020 года.

Proposed graph convolutional layer scheme

Proposed graph convolutional layer scheme

Алгоритмы машинного обучения уже широко используются в управлении рисками, помогая банкам в оценке клиентов и их финансового положения. «Современный человек и особенно клиент банка постоянно оставляет свои следы в цифровом мире. Например, информация о переводе денег другому лицу всегда остается в платежной системе. Таким образом, у каждого человека образуется большое количество связей, которые можно представить в виде направленного графа, содержащего дополнительную полезную информацию для оценки клиента. Основная задача нашего исследования – обеспечить эффективную обработку и использование больших объемов разнообразной информации о связях между клиентами», − отмечается в опубликованной статье.

Исследователи Сколтеха Максим Панов, Кирилл Федянин и их коллеги из банковской сферы смогли показать, что использование данных о переводах между клиентами значительно улучшает качество кредитного скоринга по сравнению с алгоритмами, в которых используются только данные о заданном клиенте. Учет таких данных не только позволит банкам готовить более выгодные предложения для своих надежных клиентов, но и снизит негативные последствия мошеннических действий.

«Любой отдельно взятый клиент банка характеризуется в том числе совокупностью его социальных и финансовых связей с другими людьми, поэтому в нашем случае клиенты банка рассматривались как группа взаимосвязанных финансовых агентов. В данном исследовании мы поставили перед собой задачу выяснить, применима ли к финансовым агентам известная пословица «Скажи мне, кто твой друг, и я скажу, кто ты»», − говорит Максим Панов.

Исследователи использовали сверточную графовую нейронную сеть специальной архитектуры для обработки графов, в которых узлы графа соответствуют обезличенным идентификаторам клиентов банка, а ребра – связям между ними. Таким образом обеспечивается агрегирование данных связанных клиентов и прогнозирование кредитного рейтинга для заданного клиента. Главная особенность предложенного подхода − возможность обработки крупномасштабных временны́х графов, присутствующих в банковских данных, в неизменном виде, т.е. без какой-либо предварительной обработки, которая зачастую очень трудоемка и приводит к частичным потерям содержащейся в этих данных информации.

Исследователи провели тщательное экспериментальное сравнение шести моделей, в котором победу одержала модель EWS-GCN. «Успех этой модели можно объяснить тремя факторами. Во-первых, модель напрямую обрабатывает полные данные о банковских транзакциях и тем самым сводит к минимуму потери содержащейся в них информации. Во-вторых, структура модели специально построена таким образом, чтобы модель одновременно обладала высоким качеством предсказания и была вычислительно эффективной. Наконец, мы предложили специальную процедуру обучения для системы в целом», − отмечает Максим Панов.

Он также подчеркивает, что любая модель, предназначенная для использования в банковской сфере, должна быть очень надежной. «Сложные модели нейронных сетей пока остаются уязвимыми для адверсальных атак, поэтому прежде чем говорить о внедрении таких моделей в производственный процесс, необходимо до конца разобраться в таком феномене, как адверсальные атаки, в приложении к нашей модели и провести дополнительные исследования», − отмечает в заключение Панов.

Контакты:
Skoltech Communications
+7 (495) 280 14 81

Share on VK