Данное исследование ставит перед собой цель проверить:
1. Как количество детей влияет на возврат кредита в срок
2. Есть ли зависимость между семейным положением и возвратом кредита в срок
3. Есть ли зависимость между уровнем дохода и возвратом кредита в срок
4. Как разные цели кредита влияют на его возврат в срок
Результаты исследования будут учтены при построении модели кредитного скоринга — специальной системы, которая оценивает способность потенциального заёмщика вернуть кредит банку.
План:
Итог:
Данные о заемщиках содержали множественные неточности и ошибки. Была проведена обработка аномалий, удаление дубликатов и заполнение пропусков, используя методы машинного обучения.
По итогам исследования можно сделать выводы, что:
-
Люди с большим числом детей (от 4) чаще других не возвращают кредит вовремя
-
Люди, которые когда-либо состояли в браке, реже становятся должниками
-
Возвращение кредита в срок мало зависит от дохода клиента
-
Операции с недвижимостью наиболее безопасный тип кредита для банка. Потом идут проведение свадьбы и получение образования. Самый небезопасный кредит - на приобретение автомобиля
Структура данных:
Данные о заемщиках находятся в файле banking_data.csv
:
-
children
— количество детей в семье -
days_employed
— общий трудовой стаж в днях -
dob_years
— возраст -
education
— уровень образования клиента -
education_id
— идентификатор уровня образования -
family_status
— семейное положение -
family_status_id
— идентификатор семейного положения -
gender
— пол клиента -
income_type
— тип занятости -
debt
— имел ли задолженность по возврату кредита -
total_income
— ежемесячный доход -
purpose
— цель получения кредита