Прогнозирование дефолтов в российском банковском секторе

Прогнозирование дефолтов в российском банковском секторе

Елена Синельникова-Мурылева
Таисия Горшкова
Наталья Макеева


Банковский сектор — один из основных секторов финансового рынка, выполняющий трансформацию активов. Определение и прогнозирование банковской стабильности оказывает огромное влияние на принятие решений всеми участниками рынка. В отечественном банковском секторе существуют проблемы с достаточностью капитала и качеством активов, препятствующие стабильному развитию и росту экономики [Белоусова, 2009; Воловник и др., 2011]. Большое количество банковских дефолтов усугубляет эти трудности и увеличивает обший уровень задолженности в экономике. В данной статье дія прогнозирования дефолтов в банковском секторе, помимо стандартных подходов, впервые на российских данных применяется алгоритм машинного обучения «случайного леса», результаты которого сравниваются с другими моделями для выявления наилучшей на основе показателя средней абсолютной ошибки прогноза.

Работа имеет следующую структуру. В первой части рассмотрены теоретические предпосылки индивидуальных банковских кризисов (набега на банк) и выявлены эмпирические факторы — предвестники дефолтов, имеющие влияние на вероятность обвалов в российском и зарубежных банковских секторах. Во втором разделе проведены расчеты на фактических данных и проанализированы результаты. В заключении описаны основные итоги исследования.

Набег на банк: обзор теории и эмпирические исследования

Банковские депозитные договоры, как правило, позволяют вкладчикам снять номинальную стоимость своих вкладов по требованию. До тех пор пока часть таких вкладов используется для финансирования неликвидных и рискованных ссуд или инвестирования, существует вероятность кризиса ликвидности, который может привести к дефолту банка. Большинство теоретических моделей рассматривают этот вопрос в агрегированной структуре, представляющей всю банковскую отрасль как единую сущность. Тем не менее важно различать набеги на банк, которые влияют на отдельно взятый банк, то есть индивидуальные банковские кризисы, и банковские паники (системный риск), которые касаются всего банковского сектора, платежной системы и межбанковского рынка.

Подробным изучением и моделированием набегов на банк занимались в своей работе Дуглас Даймонд и Филип Дибвиг [Diamond, Dybvig, 1983]. Они рассматривали однотоварную трехпериодную экономику, в которой присутствует континуум агентов (вкладчиков, потребителей), наделенных единицей блага в нулевой период и желающих потреблять в периоды 1 (нетерпеливые агенты) или 2 (терпеливые агенты). Также в экономике существует долгосрочная производственная технология — такая, что инвестирование одной единицы в нулевой момент времени при носит доход, превышающий первоначальное вложение во втором периоде, а при прерывании технологии в первом периоде ликвидационная стоимость в точности равна первоначальным затратам. Авторы показали, что система страхования вкладов может обеспечить реализацию Парето-доминирующего равновесия за счет гарантирования выплаты обещанного дохода всем агентам, желающим снять вклад. В работе предлагается использовать государственное страхование, поскольку частные компании ограничены имеющимися у них ресурсами, в то время как государство обладает правом взимать налоги. Для вкладчиков имеет значение посленалоговая ценность их дохода от снятия ввиду того, что это является конечной суммой их потребления. Таким образом, налогообложение сдерживает вкладчиков второго типа от досрочного снятия денежных средств.

Дальнейшее изучение этой темы заключалось в попытках модифицировать классическую модель Даймонда — Дибвига. Например, Варадараджан Кари и Рави Джаганатан [Chari, Jagannathan, 1988] рассматривали модель, в которую была введена случайным образом формирующаяся доходность от инвестиций во втором периоде. Основным выводом работы этих авторов является то, что при добавлении стохастической модификации инвестиционной технологии без ввода специальных механизмов всегда будет реализовываться равновесие с набегом. Еще одной модификацией является увеличение временного горизонта. Одна из таких моделей, расширенная до четырех периодов, была предложена Мерваном Инжиниром [Engineer, 1989]. Автор показал, что при такой постановке задачи (поскольку предпочтения агентов выявляются в течение долгого времени) стандартный механизм предотвращения кризиса путем приостановки конвертируемости не работает, приводя к реализации с некоторой вероятностью равновесия с набегом на банк. Джеймс Пек и Карл Шелл [Peek, Shell, 2003] добавили в игру спецификацию до внесения депозита. Если в классической модели рассматривались ситуации, когда деньги уже вложены, то здесь авторы предлагали проанализировать случай, когда депозит может быть не открыт. Было показано, что в таком случае оптимальный механизм также может включать в себя равновесие с набегом на банк. Чао Гу [Gu, 2011[ в свою очередь рассматривал модификацию классической модели, где период 1 разделен на N+1 подпериодов, что позволяет уловить «стадные» эффекты, опускаемые в классической работе. В этом случае в экономике с неопределенностью в отношении возвратности инвестиций очередь в банк содержит информацию о состоянии инвестиционного портфеля банка. Сводные данные по каждой модели, полученные на основании проведенного анализа, приведены в табл. 1.

Таблица 1

Классификация теоретических моделей

Подход

Модель

Спецификация

Вывод

Классический

[Diamond, Dybvig, 19831

Государственная система страхования депозитов

Страхование депозитов предотвращает набег на банк

Стохастическая модификация

[Chaii, Jagannallian.

1988]

Стохастический доход

Набег на банк происходит в любом случае

Увеличение временного горизонта

[Engineer, 1989]

Приостановка конвертируемости

Приостановка выдачи наличных не устраняет набеги на банк

Изменение предпосылок относительно вкладчиков

[Peck. Shell, 2003]

Различные функции полезности

Оптимальный банковский механизм допускает вероятность набега на банк

Модификация структуры периодов

[Gu, 2011]

Разбиение второго периода на N+1 подпериодов

Очередь содержит информацию о состоянии инвестиционного портфеля банка

Источник: составлено авторами.

Эмпирические исследования дефолтов банков в отличие от теоретических направлены не только на изучение различных факторов и ситуаций, которые могут спровоцировать кризис, но и на прогнозирование возможных «падений». Иными словами, эмпирические модели прогнозирования предоставляют регулирующим органам банка и другим заинтересованным агентам систему раннего оповещения, которая, используя текущую финансовую информацию, выявляет «тревожные» учреждения. Наиболее часто используемыми в таких исследованиях являются пробит- и логит-модели, поскол ьку они могут, основываясь на динамике известных финансовых показателей, оценивать вероятность обвала банка в ближайшем будущем, однако всё больше исследований в последние годы посвящается изучению моделирования вероятности дефолтов с помощью алгоритмов машинного обучения.

Одной из работ, базирующихся на основе логит-моделей, является исследование Дар-Йеха Хванга, Ченга Ли и Томаса Льава |Hwang et аі., 1997|, которые занимались анализом обвалов банков в США в период с 1985-го по 1988 год. Результаты этого исследования свидетельствуют в пользу строгого нормативного контроля и установления минимального размера собственного капитала. Другим примером использования логит-модели является работа Даниэля Мартина |Martin, 1977]. Он оценивал вероятность банкротства банка в 1970-е годы на основе исторических данных обо всех банках — членах Федеральной резервной системы. Его работа интересна тем, что в ней было введено формальное деление используемых переменных по описываемой ими информации на четыре обобщенные группы, отвечающие за: (1) рисковые активы, (2) ликвидность, (3) достаточность основного капитала и (4) прибыль.

Поскольку системные банковские кризисы для развивающихся стран относительно более дорогостоящие с точки зрения расходов бюджета, чем для промышленно развитых стран, их прогнозирование на более ранних этапах — актуальная задача [Caprio, Klingebiel. 1996]. Подобный вопрос поднимал в своей работе Марко Арена [Arena, 2008], рассматривая эпизоды системных кризисов в Латинской Америке и Восточной Азии и тестируя, возможно ли, что во время кризиса обваливаются в основном изначально слабые банки, то есть банки с плохими показателями индивидуальной отчетности. Результаты демонстрируют, что системные потрясения (макроэкономические или шоки ликвидности), которые спровоцировали банковские кризисы, главным образом, дестабилизировали банки, ослабленные еще до этих потрясений.

Другой работой, посвященной проблеме банкротства банков, является исследование Ахлема Сельмы Мессаи и Мохамеда Имен Галлали [Messai, Gallali. 2015]. Эта работа продемонстрировала эффективность новых искусственных нейронных методов по сравнению с другими классическими подходами. Эти новые методы уже используются в нескольких областях, но лишь недавно етапи применяться для прогнозирования кризиса финансовых систем.

Эмпирические работы, посвященные прогнозированию дефолтов в российском банковском секторе, также сосредоточены на выявлении факторов индивидуальной банковской деятельности, которые влияют на вероятность обвала. Тем не менее в отличие от работ Анатолия Пересецкого с соавторами [Peresetsky et al.,2011] и Андрея Зубарева [Зубарев, 2013], сосредоточенных на анализе факторов — предвестников дефолтов, некоторые зарубежные авторы, такие как Софи Клаис и Коен Шуре [Claeys, Schoors, 2007] и Жарко Фидрмук и Филипп Сюсс IFidrmuc, Süss, 2011], рассматривали российскую банковскую систему на более глубоком уровне. Так. в работе Клаис и Шурса было показано, что в своей лицензионной политике Банк России руководствуется не только микро-, но и макропруденци-альными характеристиками. Результаты исследования Фидрмука и Сюсса свидетельствуют о том, что если расширить определение дефолта банка, добавив, помимо условия отзыва лицензии, получение прямой государственной поддержки и принудительное слияние или поглощение, то факторы-предвестники не изменятся и будут совпадать с выявленными ранее.

Основные сведения по факторам, влияющим на вероятность банкротства в зарубежных и российском банковских секторах, представлены в табл.2.

Таблица 2

Факторы и их влияние на вероятность банкротства зарубежных и российских банков

Фактор

Влияние

Страна

Исследование

Доля ликвидных активов в обшей сумме активов

США

[Hwang et al., 1997]

Доля недвижимости, находящейся в собственности, в общей сумме активов

+

США

[Hwangel al., 1997]

Отношение просроченных кредитов к общей сумме активов

+

США

[Hwang et al., 1997]

Доля собственного капитала в обшей сумме активов

США

[Hwang et al., 1997]

Россия

[Fidrrauc, Süss, 2011 ]

Отношение оборотного капитала к рисковым активам

США

[Martin. 1977]

Чистый доход, нормированный на сумму совокупных активов

США

[Marlin. 1977]

Доля коммерческих кредитов в обшем объеме выданных ссуд

+

США

[Martin. 1977]

Отношение расходов к операционному доходу

+

США

[Martin, I977|

Россия

[Fidrmuc, Süss, 2011]

Отношение ликвидных активов к общей сумме обязательств (пассивов)

Страны Азии и Латинской Америки

[Arena, 2008]

Отношение сумм выданных кредитов к совокупным активам

+

Страны Азии и Латинской Америки

[Arena, 2008]

Россия

[Fidrmuc, Süss, 2011]

Рентабельность активов

Страны Азии и Латинской Америки

[Arena, 2008]

Россия

[Claeys. Schoors, 2007]

Огношение резервов по возможным потерям по кредитам к общей сумме выданных ссуд

+

Страны Азии и Латинской Америки

[Arena, 2008]

Страны Европы

[Messai. Gallali. 2015]

Коэффициент средней отдачи собственного капитала

+

Страны Европы

[Messai, Gallali, 2015]

Россия

1 Fidrmuc. Süss. 2011]

Огношение резервов по возможным потерям к совокупным активам

Россия

[Pereselsky et al., 2011]

Доля кредитов нефинансовых организаций в совокупных активах

+

Россия

[Peresetsky et al., 2011]

Резервы по возможным потерям по кред итам

+

Россия

[Зубарев, 2013]

Объем просроченной задолженности

Россия

[Зубарев, 2013]

Источник: составлено авторами.

Большинство моделей прогнозирования обвалов банков используют переменные, которые могут быть классифицированы по четырем из пяти факторов CAMEL1. Переменная, которая, как правило, отсутствует, характеризует качество управления. В некотором смысле это удивительно, поскольку многие исследования прогнозирования банкротства банка пришли к выводу, что качество и эффективность управления банком являются значимыми причинами обваїа. В целом значимые факторы и тенденции их влияния в разных странах схожи. Например, отношения, характеризующие доходность, уменьшают вероятность обвала банка. Отношения, связанные с кредитными операциями (выданными, просроченными кредитами или резервами по возможным потерям по кредитам), имеют положительное влияние на вероятность обвала банка. Стоит отметить, что ряд факторов, выявленных для российского банковского сектора, и направления их влияния полностью совпадают с показателями, используемыми для прогнозирования обвала зарубежных банков. Причем эти факторы значимы для прогнозирования банковских кризисов не тол ько в странах с развивающейся экономикой, но и в США, и в странах Европы.

Модели прогнозирования дефолтов в российском банковском секторе

Как уже было сказано, набег на банк влияет на отдельно взятый банк и происходит, когда вкладчики получают плохие новости о его работе и, опасаясь банкротства, реагируют изъятием своих средств. В данном исследован ии основной упор делается на прогнозирование фундаментальных набегов на банки (из рассмотрения исключены системные кризисы), то есть когда банки действител ьно имеют плохие финансовые показатели. Иными словами, для прогнозирования дефолтов выбран микропруденциальный подход: рассматриваются индивидуальные обвалы, для исследования используются финансовые (микроэкономические) переменные, рассчитанные на основе бухгалтерской отчетности.

Для проведения корректного исследования необходимо четкое определение обвала, чтобы исключить из выборки банки, чьи лицензии были отозваны из-за махинаций или просто ликвидированные по собственной инициативе. В данной статье это определение сформулировано следующим образом: считается, что дефолт банка произошел тогда и только тогда, когда среди перечня причин отзыва лицензии фигурировали хотя бы две из нижеперечисленных2: (1) значение всех нормативов достаточности собственных средств (капитала) кредитной организации становится ниже чем 2%; (2) размер собственных средств (капитала) кредитной организации ниже минимального значения уставного капитала, установленного на дату государственной регистрации кредитной организации; (3) кредитная организация не исполняет в срок, установленный параграфом 4.1 главы IX Федерального закона «О несостоятельности (банкротстве)», требования Банка России о приведении в соответствие величины уставного капитала и размера собственных средств (капитала); (4) кредитная организация не способна удовлетворить требования кредиторов по денежным обязательствам и (или) исполнить обязанность по уплате обязательных платежей в течение 14 дней с наступления даты их удовлетворения и (или) исполнения; (5) банк в период после 1 января 2015 года в течение трех месяцев подряд допускает снижение размера собственных средств (капитала) ниже минимального размера собственных средств (капитала).

После определения критериев дефолта была сформирована выборка из двадцати восьми финансовых показателей, включающих в себя как чистые показатели из отчетности, так и производные от них (см. Приложение А). Всего в выборке использовались квартальные данные о 661 банке за период с 1 квартала 2015 года вплоть до I квартала 2017 года. Для обучающей выборки был выбран промежуток с начата 2015-го по конец 2016 года, вероятность обвала прогнозировалась для I квартала 2017 года. Двухгодичный период был выбран по двум причинам: во-первых, такой период охватывает среднее время между отзывом лицензии и ликвидацией банка, а во-вторых, этот период, согласно проведенным эмпирическим исследованиям, обладает самой высокой прогнозирующей способностью [Peresetsky et al., 2011]. Сам прогноз в предлагаемом исследовании осуществлялся с помощью бинарных панельных логит-моделей и модели «случайного леса». Зависимая переменная в обоих случаях являлась бинарной и характеризовала вероятность обвала, принимая значение 0, если банк продолжат свою деятельность, и 1, если произошел дефолт.

Построение логит-модели

После формирования и сбора данных и разбиения их на обучающую и контрольную выборки была проведена очистка собранных данных: удалены явные ошибки ввода и измерения, а также статистические выбросы. Стоит отметить, что выбросы удалялись только для продолжающих работу банков, так как в случае дефолтов они могут на самом деле являться теми самыми «плохими новостями» о работе банка, которые мы стараемся выявить при прогнозировании. Тем не менее для построения наиболее эффективной модели бинарного выбора рекомендуется также проводить предварительный анализ переменных, а не только избавляться от статистических ошибок сбора данных. Авторы решили провести ANOVA-тест на разделительную способность переменных. Данная процедура является разновидностью дисперсионного анализа и заключается в том, что проверяется наличие статистических различий между средними исследуемых групп. В данном случае деление по группам происходит на основании оцениваемой бинарной переменной, то есть в зависимости от того, произошел дефолт или нет. Были протестированы все двадцать восемь показателей, а также три из них в логарифмическом виде (такая зависимость была выбрана на основе анализа взаимосвязи с объясняемой переменной), в результате чего выявлено четырнадцать показателей (см. Приложение В). Они являются потоковыми, поэтому их можно принять за стационарные, опустив проверку на единичный корень. Из-за того что в выбранный временной промежуток (1 квартал 2015-го — 1 квартал 2017 года) не было сильных потрясений банковского сектора, также можно утверждать, что существенных сдвигов в рядах нет. Проведение тестирования с помошью разновидности критерия Хаусмана необходимо для обоснования использования модели со случайными эффектами (re) и модели пула (ра). Нулевая гипотеза не была отвергнута ни на одном из разумных уровней значимости, что говорит о состоятельности оценок в построенных ниже моделях.

Построение обеих моделей: и модели пула, и модели со случайными эффектами — начиналось с одинаковой базовой спецификации, включающей все переменные, отобранные при предварительном анализе показателей на основе ANOVA-теста. Далее спецификации сужались на основе тестов об индивидуальной значимости и теста Вальда для проверки одновременного равенства нулю коэффициентов при незначимых по отдельности переменных. Алгоритм отбора проводился до получения модели со всеми значимыми переменными.

Анализ начался с построения модели пула. После проведения описанного выше процесса отбора переменных была специфицирована модель с девятью регрессорами (см. Приложение С, табл. С1). Почти все полученные знаки коэффициентов при этих переменных, или, иными словами, влияние на вероятность дефолта банка, совпадают с ожидаемыми знаками, которые охарактеризованы на основании анализа, проведенного в первой части работы (табл. 3). Например, увеличивает вероятность обвала такой показатель, как отношение кредитного портфеля к активам-нетто. Это объясняется тем, что кредиты являются активами банка, и если они составляют большую часть активов, это говорит о плохой организации деятельности и неправильных вложениях и распределении средств. Остальные переменные имеют отрицательное влияние на вероятность дефолта банка, что также согласуется с экономическими обоснованиями и работами других авторов.

Таблица 3

Ожидаемое и полученное влияние факторов на вероятность дефолта

Показатель

Ожидаемый знак

Полученный знак (рч)

Полученный знак (re)

Чистый доход, нормированный на сумму активов-нетго


Отношение кредитного портфеля к активам-нетто

+/-

+


Доля промышленных кредитов в общем объеме кредитного портфеля

Отношение промышленных кредитов к активам-нетто

+


+

Отношение коммерческих кредитов к активам-негго

Рентабельность активов- нетто

Уровень просроченной задолженности по кредитному портфелю

+

Уровень обеспечения кредитного портфеля залогом имущества


Норматив достаточности капитала Н1

Логарифм средств предприятий и органи заций

Источник: расчеты авторов.

Из общего ряда показателей выбивается уровень просроченной задолженности по кредитному портфелю, которая, согласно полученной модели, имеет отрицательное влияние на вероятность дефолта (при ожидаемом положительном). Это объясняется спецификой работы Банка России: банки заранее получают уведомления о вероятном отзыве лицензии и стараются привести к норме показатели своей деятельности. Как следствие, согласно исследованиям Банка России у обвалившихся банков практически нет просроченной задолженности. Также можно сказать, что такой результат частично согласуется с выводом Зубарева [Зубарев, 2013|, который рассматривал общий объем просроченной задолженности в кредитном портфеле для российских банков и продемонстрировал отрицательное влияние этого показателя на вероятность дефолта.

Результаты прогноза поданной модели представлены в табл. 4. Полученная pa-модель правильно классифицирует три банка из четырех обвалившихся, предсказывая 75% дефолтов. При этом из 528 продолжающих работу банков модель пула классифицирует четыре банка как обанкротившиеся. Это говорит о том. что общая прогнозная сила модели составляет 99,06%.

Таблица 4

Результаты прогноза модели пула


Вероятность обвала

Прогнозируемая классификация

Всего


0

1


Абсолютный показатель

0

524

4

528

1

1

3

4

Относительный показатель (%)

0

99.24

0,76

100

1

25

75

100

Источник: расчеты авторов.

Далее по тому же алгоритму была специфицирована модель со случайными эффектами. Полученная модель включала в себя уже семь регрессоров (см. Приложение С, табл. С1). В этом случае в отличие от модели пула незначимыми оказались чистый доход, нормирован ный на сумму активов-нетто, отношение кредитного портфеля к активам-нетто и уровень обеспечения кредитного портфеля залогом имущества. В то же время в модель добавился показатель, характеризующий отношение промышленных кредитов к активам-нетто, который положительно влияет на вероятность дефолта. В данном случае это объясняется спецификой российских данных: большинство взятых кредитов относятся к займам малого и среднего бизнеса, то есть с учетом нестабильной экономической ситуации они не являются самым надежным активом банка. Знаки коэффициентов при других показателях совпадают со знаками, полученными при спецификации модели пула. То, что при построении модели со случайными эффектами снова было получено значимое отрицательное влияние уровня просроченной задолженности по кредитному портфелю, говорит об устойчивости этого результата на фактических российских данных.

Результаты осуществленной на основе построенной re-модели классификации на обвалившиеся и продолжающие работать банки представлены в табл. 5. Модель также правильно классифицирует три банка из четырех обвалившихся, давая корректный прогноз 75% дефолтов. Однако в этом случае уже девять банков из продолжающих работу классифицируются как обанкротившиеся, то есть правильно предсказывается 98,30% продолжающих свою деятельность банков. За счет увеличения ошибки II рода, когда классификация I присваивается в действительности работающим банкам, общая прогнозная сила модели составляет 98,12%.

Таблица 5

Результаты прогноза модели со случайными эффектами


Вероятность обвала

Прогнозируемая классификация

Всего


0

1


Абсолютный показатель

0

519

9

528

1

1

3

4

Относительный показатель (%)

0

98,30

1,70

100

1

50

50

100

Источник: расчеты авторов.

Полученные результаты говорят, что, хотя согласно теории re-модель должна лучше соответствовать данным (Носко, 2016), прогноз, сделанный на основе pa-модели, бол ьше соответствует действительности.

Построение модели «случайного леса»

В отличие от панельных логит-моделей бинарного выбора построение алгоритма «случайного леса» не требует предварительной очистки переменных. Корректному построению модели прогнозирования с помощью «случайного леса» не мешают ни единичные корни, ни сдвиги, ни другие аномалии панельных данных. По этой причине единственное, что необходимо было сделать перед началом построения, — очистить данные от ошибок ввода и выбросов (для продолжающих работать банков).

Модель «случайного леса» не дает интерпретируемых коэффициентов. Результатом процесса обучения является агрегированный по всем деревьям процесс построения прогноза — классификации банков по 0 и 1. Построенный алгоритм «случайного леса» на обучающей выборке верно прогнозирует 53 обвалившихся банка из 100 и неверно приписывает дефолт шести продолжающим работать банкам (см. Приложение С, табл. С2). С учетом полученных характеристик модель признана пригодной для прогнозирования на контрольной выборке. Результаты полученного прогноза представлены в табл. 6.

Таблица 6

Результаты прогноза модели «случайного леса»


Вероятность обвала

Прогнозируемая классификации

Всего


0

1


Абсолютный показатель

0

528

0

528

1

2

2

4

Относительный показатель (%)

0

100

0

100

1

50

50

100

Источник: расчеты авторов.

В рамках контрольной выборки алгоритм «случайного леса» верно классифицирует все банки, продолжающие свою деятельность, то есть полученная модель верно определяет 100% необанкротившихся банков. При этом из четырех действительно потерпевших дефолт банков алгоритм правильно находит только два. Таким образом, общая доля правильно классифицированных банков составляет 99,62%.

Сравнение полученных моделей

Как уже было отмечено в предыдущем разделе, основное отличие между прогнозированием с помощью алгоритма «случайного леса» и прогнозированием с помощью логит-моделей заключается в том, что в панельных моделях бинарного выбора получаются интерпретируемые коэффициенты. Построенные pa- и re-модели дают не только классификацию банков как продолжающих свою деятельность и прекративших ее. но и выявляют своего рода индикаторы — предвестники дефолта. Иными словами, пользуясь результатами построенных моделей при изучении банковской отчетности и других показателей, посчитанных на ее основе, можно дать характеристику банку и проанализировать, близок ли он к дефолту или же его работа стабильна. Отсутствие интерпретируемости модели прогнозирования, основанной на алгоритме «случайного леса», представляет собой явный недостаток с экономической точки зрения. Однако чтобы корректно сравнить полученные модели, необходима еще и эконометрическая интерпретация, и критерий сравнения. Авторы решили сравнивать среднюю абсолютную ошибку (МАЕ). Также в качестве характеристики сравнения была использована доля правильно классифицированных банков, которая определялась как (1—МАЕ). Для удобства интерпретации оба показателя взяты в процентах (табл. 7).

Таблица 7

Сравнение прогнозной силы моделей

Модель

МАЕx100%

(1-МAЕ)х%

pa-модель

0,94

99,06

re-модель

1,88

98,12

«случайный лес»

0,38

99,62

Источник: расчеты авторов.

Средняя ошибка прогноза для модели со случайными эффектами составляет 1,88%, что является наибольшим значением этого показателя среди всех построенных моделей. У модели пула показатель средней ошибки меньше и составляет уже только 0,94%. Это подтверждает вывод о том, что pa-модель работает лучше, верно классифицируя 99,06%, в то время как re-модель верно классифицирует 98,12%. Значение показателя МАЕ в процентах для «случайного леса» еще меньше и составляет всего 0,38%, что дает общую долю верно классифицированных банков, равную 99,62%. Такой высокий показатель получен за счет того, что ни один из продолжающих свою деятельность банков не был отнесен к обанкротившимся.

Полученный результат согласуется с более ранними исследованиями, свидетельствующими о том, что логит-модели больше не являются наиболее эффективными моделями для прогнозирования. Модели, основанные на алгоритмах машинного обучения, хоть и дают неинтерпретируемый результат, но обладают большей прогнозной силой, позволяющей добиться более верного определения продолжающих свою работу и прекративших ее банков.

Заключение

В данной статье была поставлена цель прогнозирования дефолтов в российском банковском секторе и сравнения прогнозной силы использованных моделей для выявления наилучшей.

Для реализации данной цели в первой части работы рассмотрены теоретические предпосылки индивидуальных обвалов банков, а также проведен анализ эмпирических исследований банковских дефолтов в зарубежных странах и в Российской Федерации. Было продемонстрировано, что показатели бухгалтерской и финансовой отчетности оказывают прямое воздействие на вероятность обвала банка.

На основе выводов, сделанных в первой части работы, во втором разделе проведены расчеты, необходимые для построения моделей, прогнозирующих вероятность дефолта в российском банковском секторе. Построенные панельные логит-модели дают корректную характеристику факторов — предвестников дефолтов, совпадающую с результатами предыдущих исследований и отражающую особенности российских банков. В частности, если отношение кредитного портфеля к активам-нетто или отношение промышленных кредитов к активам-нетто увеличивается, то это может служить для вкладчиков сигналом к тому, чтобы не вкладывать средства в этот банк или же изъять их из него. В свою очередь возрастающая динамика таких показателей. как отношение коммерческих кредитов к активам-нетто и уровень обеспечения кредитного портфеля залогом имущества, свидетельствует о снижении вероятности дефолта. Если же увеличиваются (в разумных пределах, то есть не выше установленной верхней границы для этих показателей) норматив достаточности капитала H1, рентабельность активов-нетто, а также чистый доход, нормированный на сумму активов-нетто, то это уже будет свидетельством уменьшен ия вероятности дефолта данного банка, и поэтому его можно считать более надежным для вложения денежных средств. Отдельно стоит отметить влияние динамики такого показателя, как уровень задолженности по кредитному портфелю, поскольку его отрицательное влияние на обвал банка отражает особенности работы Банка России при отзыве лицензий. Если говорить о более формальных результатах, то модель, согласно теории больше подходящая для описания данных, верно классифицирует 98,12% банков и обладает меньшей прогнозной силой, чем модель пула, корректно определяющая состояние 99,06% банков. Наибольшей прогнозной силой обладает модель, основанная на алгоритме машинного обучения «случайного леса», впервые примененная к анализу российских банковских данных и верно определяющая вероятность дефолта 99,62% банков.

Полученные результаты можно использовать дія создания системы раннего оповещения банковских дефолтов; в частности, на основе логит-моделей рекомендуется проведение анализа финансовой отчетности с целью выявления сигналов «плохой» работы банка, а с помощью модели «случайного леса» — осуществление прогнозирования вероятности дефолтов в российском банковском секторе. Таким образом, результаты, предложенные в данной работе, могутбыть использованы как частным сектором, так и монетарными властями.


1 С capital adequacy, или достаточность капитала; Л asset quality, или качество активов". М management, или качество управлення; Е - earnings, или доходность; I. liquidity, или ликвидность.

2 Перечень причин, включенных в определение дефолта, был сформирован на основе er. 20 Федерального закона «О банках и банковской деятельности» от 02.12.1990 № 395- 1. Данные о причинах отзыва лицензии отдельно взятого банка были собраны на основании приказа об отзыве лицензии или ее ликвидации, изданного Банком России.


Приложение А

Таблица

Обозначение и характеристики используемых переменных

Показатель

Обозначение/ расчет

Показатель

Обозначение/ расчет

Акти вы-нетто

na

Рентабельность активов-нетто

ROA

Чистая прибыль

ni

Рентабельность каїштаїа

ROE

Капитал (по форме 123)

с. 123

Кредитный портфель

ср

Кредиты предприятиям и организациям

с.Ь

Уровень резервирования по кредитному портфелю

IR

Просроченная задолженность в кредитном портфеле

LLPGL

Уровень обеспечения кредитного портфеля залогом имущества

LCP

Вклады физических лиц

dep.f

Норматив ликвидности H2

H2

Кредиты физическим лицам

с .f

Норматив ликвидности HЗ

H3

Просроченная задолженность по кредитам физических лиц

LLP.c.f

1 Іорматив достаточности капитала H1

H1

Уровень просроченной

задолженности

по кредитному портфелю

LLP

Доля коммерческих кредитов в общем объеме кредитного портфеля

cf=c.f/cp

Просроченная задолженность по кредитам предприятий и организаций

LLP.c.b

Доля промышленных кредитов в общем объеме кредитного портфеля

cb=c.b/cp

Выданные МБК

ibl

Отношение коммерческих кредитов к активам-нечто

naf=c.f/na

Средства предприятий и организаций

dep.b

Отношение промышленных кредитов к активам-нетто

nab=c.b/na

Валютный оборот к активам-нетго

fr.na

Отношение кредитного портфеля к активам-нетго

cpn=cp/na

Оборот по валютным операциям (тыс. руб.)

fr

Чистый доход, нормированный на сумму активов-нетто

nn=ni/na

Приложение В

Таблица

Результаты ANOVA-теста

Показатель

Обозначение

F value

Pr(>|F|)

Рентабельность активов-нетго

ROA

416,6

<2e-16***

Рентабельность капитала

ROE

18,13

2,1e-05***

Уровень просроченной задолженности но кредитному портфелю

LLP

3,53

0.0603 .

Уровень обеспечения кредитного портфеля залогом имущества

LCP

30,52

3,48e-08***

Чистый доход, нормированный на сумму активов-нетго

nn

268

<2e-16***

Норматив достаточности капитала Н1

H1

52,36

5,35e-13***

Логарифм активов-нетго ln(na)

ln(na)

28,08

1,22e-07***

Логарифм чистой прибыли

ln(ni)

7,855

0,0051**

Логарифм средств предприятий и организации

ln(dep.b)

55,56

1,07e-13***

Доля коммерческих кредитов в обшем объеме кредитного портфеля

cf

23,06

1,62e-06***

Доля промышленных кредитов в обшем объеме кредитного портфеля

cb

81,25

<2e-16***

Отношение коммерческих кредитов к активам-нетто

naf

17,07

3,66e-05***

Отношение промышленных кредитов к активам-нетто

nab

11,93

0,000556***

Отношение кредитного портфеля к активам-нетто

cpn

43,75

4.13e-11***

Примечание. Уровень значимости: *** 0,001, ** — 0,01, * — 0.05, «.» — 0,1.

Приложение С

РЕЗУЛЬТАТЫ ПОСТРОЕНИЯ МОДЕЛЕЙ

Таблица С1

Результаты оценивания логит-моделей

Показатель

Коэффициент (pa)

P>|z|

Коэффициент (re)

P>|z|

nn

-3,577

0,001

cpn

0,877

0,011

cb

-1,981

0,000

-6,764

0,000

nab

3,184

0,000

naf

-4,564

0,000

-10,7

0,000

ROA

-0,00015

0,002

-0,0006

0,000

LLP

-0,029

0,000

-0,05

0,000

LCP

-0,003

0,002

H1

-0,0330

0,000

-0,066

0,000

ln(dep.b)

-0,629

0,000

-1,516

0,000

Таблица С2

Результаты построения алгоритма «случайного леса»

as.factor(Prob) na + пі + c.123 + cp + LLPGL + dep.f + dep.b + ROA + nab + naf + cf + ROE + + LLP + IR + LCP + fr.ua + fr + III + H2 + H3 + c.f+ LLP.c.f + c.b + LLP.c.b + ibl + cb + im + cpn

Тип алгоритма «случайного леса»:

классификация

Количество «деревьев»:

5000

Количество переменных для каждого разбиения:

5

ООВ оценка коэффициента ошибок:

1,1%

Матрица несоответствий:




0

1

ошибка класса

0

4714

6

0,001271186

1

47

53

0,470000000


Литература
  1. Белоусова В. Ю. Эффективность издержек однородных российских коммерческих банков: обзор проблемы и новые результаты // Экономический журнал ВШЭ. 2009. Т. 13. №4. С. 489-519.
  2. Баловник А. Д., Кибардша Ю. С., Зиядуллаев П. С. Базель-ІІІ: испытание надежности банковской системы России в условиях глобальной конкуренции // Экономика мегаполисов и регионов. 2011. № 3. С. 40-49.
  3. Зубарев A.B. Финансовый кризис 2008 2009: факторы банкротств на примерах крупных российских банков // Российское предпринимательство. 2013. Т. 14. № 22. С. 87-94.
  4. Носко В. П. Эконометрика. Книга вторая. М.: Дело, 2011.
  5. Arena М. Bank Failures and Bank Fundamentals: A Comparative Analysis of Latin America and East Asia During the Nineties Using Bank-Level Data // Journal of Banking & Finance. 2008. Vol. 32. No 2. P 299-310.
  6. Azariadis C. Self-Fulfilling Prophecies // Journal of Economic Theory. 1981. Vol. 25. No 3. P. 380-396.
  7. BanerjeeA. К A Simple Model of Herd Behavior// The Quarterly Journal of Economics. 1992. Vol. 107. No 3. P. 797-817.
  8. Bryant J. A Model of Reserves, Bank Runs, and Deposit Insurance // Journal of Banking & Finance. 1980. Vol. 4. No 4. P. 335- 344.
  9. Calomiris C. W., Kahn С. M. The Role of Demandable Debt in Structuring Optimal Banking Arrangements // American Economic Review. 1991. Vol. 81. No 3. P. 497-513.
  10. Caprio G., Klingebiel D. Bank Insolvencies: Cross-Country Experience. World Bank Publications, 1996.
  11. Cass D„ Shell K. Do Sunspots Matter?//Journal of Political Economy. 1983. Vol. 91. No 2. P. 193-227.
  12. Chari V. V., Jagannathan R. Banking Panics, Information, and Rational Expectations Equilibrium//The Journal of Finance. 1988. Vol.43. No 3. P. 749-761.
  13. Chari V. V., Kehoe P.J. Financial Crises as Herds: Overturning the Critiques//Journal of Economic Theory. 2004. Vol. 119. No 1. P. 128-150.
  14. Claeys S., Schoors K. Bank Supervision Russian Style: Evidence of Conflicts Between Micro- and Macro-Prudential Concerns //Journal of Comparative Economics. 2007. Vol. 35. No 3. P. 630-657.
  15. Crockelt A. Marrying the Micro- and Macro-Prudential Dimensions of Financial Stability// BIS Speeches. 2000. Vol. 21.
  16. DiamondD. W., DybvigP.H. Bank Runs, Deposit Insurance, and Liquidity//Journal of Political Economy. 1983. Vol. 91. No 3. P. 401 -419.
  17. DregerC., Fidrmuc J. Drivers of Exchange Rate Dynamics in Selected CIS Countries: Evidence from a Factor-Augmented Vector Autoregressive (FAVAR) Analysis // Emerging Markets Finance and Trade. 2011. Vol. 47. No 4. P 49-58.
  18. Dybvig P. IL, Spall С. S. Adoption Externalities as Public Goods //Journal of Public Economics. 1983. Vol. 20. No 2. P. 231-247,
  19. Engineer M. Bank Runs and [he Suspension of Deposit Convertibility // Journal of Monetary Economics. 1989. Vol. 24. No 3. P. 443-454.
  20. Fidrmuc J., Süss P. The Outbreak of the Russian Banking Crisis // Czech Economic-Review. 2011. No 1. P. 46-63.
  21. Gorion G. Bank Suspension of Convertibility 11 Journal of Monetary Economics. 1985. Vol. 15. No 2. P. 177-193.
  22. Gu C. Herding and Bank Runs // Journal of Economic Theory. 2011. Vol. 146. No 1. P. 163-188.
  23. Hwang D.-Y., LeeC.F., LiawK. F. Forecasting Bank Failures and Deposit Insurance Premium // International Review of Economics & Finance. 1997. Vol. 6. No 3. P. 317-334.
  24. Jacklin C../., Bhattacharya S. Distinguishing Panicsand Information- Based Bank Runs: Welfare and Policy Implications//Journal of Political Economy. 1988. Vol. 96. No 3. P. 568-592.
  25. Marlin D. Early Warning of Bank Failure: A Logit Regression Approach I I Journal of Banking & Finance. 1977. Vol. 1. No 3. P 249-276.
  26. Mess а і A. S-, Gallali M. I. Financial Leading Indicators of Banking Distress: A Micro Pmdential Approach — Evidence from Europe // Asian Social Science. 2015. Vol. 11. No 21. P. 78-90.
  27. Mörttinen L. M., Poloni P., Sandars P. Analysing Banking Sector Conditions: How to Use Macro-Pmdential Indicators. ECB Occasional Paper. No 26. 2005.
  28. Peck J., Shell K. Equilibrium Bank Runs//Journal of Political Economy. 2003. Vol. 111. No LP. 103-123.
  29. PereselskyA. A., Karminsky A. M., Golovan S. V. Probability of Default Models of Russian Banks // Economic Change and Restructuring. 2011. Vol. 44. No 4. P 297-334.