发表自话题:怎样快速找到贷款人群
今天用excel初步分析下之前下载的数据《Loan Data》,包含数据清洗和简单的数据分析,会用到数据透视表以及几个函数,希望从这份数据里分析出贷款人的基本信息,以便为之后贷款客户的选择做出规划。把数据来源链接附上《Loan Data》,总共包含有11个字段,500行数据。数据里包含的字段有:
loan_ID(贷款ID)、loan_status(贷款状态)、Principal(贷款金额)、terms(贷款期限)、effective_date(开始时间)、due_date(到期时间)、paid_off_time(还款时间)、past_due_days(逾期天数)、age(年龄)、education(教育水平)、gender(性别)。
提出几个问题:
1、不同年龄层次对于贷款的需求情况,贷款的主要集中年龄层
2、贷款人群中男女性别比例情况以及不同性别间的逾期率情况
3、贷款人群中学历分布以及不同学历间的逾期率情况
4、贷款期限选择情况
数据清洗:
1、列名重命名
此次是在excel中分析较少的数据,为了更清晰的展示,我先把英文列名翻译成中文
2、重复值、缺失值、异常值处理
担心数据中有重复数据,根据贷款人ID查询并未有重复值;除偿还时间、逾期天数外其它数值均为500行,未有缺失情况;单元格格式以及数据均无异常情况。
用excel进行数据分析:
1、不同年龄层次对于贷款的需求情况,贷款的主要集中年龄层
首先对年龄进行描述统计分析,分析结果如(图1)所示:一共有500名用户,最小贷款年龄为18岁,最大为51岁,平均为31岁,以5岁为一个区间:(18-22)...(48-52)。用COUNTIFS函数(=COUNTIFS(I:I,">=18",I:I,"
上一篇:大数据在金融行业的应用
2021-01-23
2020-09-29
2020-09-29
2020-09-29
2020-09-29
2020-07-29
2020年分析6家银行「信用卡」背后的贷款,你知道有多少呢?
2020-07-29
2020-07-29
2020-07-29
2020-07-29