发表自话题:怎样快速找到贷款人群
1、数据准备
下载的数据《Loan Data》,从这份数据里分析出贷款人的基本信息,以便为之后贷款客户的选择做出规划.
链接:
/s/1Kuw9MA6d_HXbbYnGtCnKzg提取码:b13j
《Loan Data》:loan_ID(贷款ID)、loan_status(贷款状态)、Principal(贷款金额)、terms(贷款期限)、effective_date(开始时间)、due_date(到期时间)、paid_off_time(还款时间)、past_due_days(逾期天数)、age(年龄)、education(教育水平)、gender(性别)
2、提出几个问题
1、贷款人群中男女性别比例情况以及不同性别间的逾期率情况
2、贷款人群中学历分布以及不同学历间的逾期率情况
3、贷款期限选择情况
3、数据清洗
查看数据源:
可以看出数据有500条。
3、1 重复值
查看有无重复值
如图,使用
SELECT DISTINCT Loan_ID FROM loan;查询loan_id 不重复的数据,结果有500条数据,故无重复值
3、2 缺失值
使用代码,查询
SELECT count(loan_id) FROM loan;结论:可以看出男性贷款人数和比率比女性贷款的高得多,男性贷款人逾期百分比也比女性的高
4、2 贷款人群中学历分布以及不同学历间的逾期率情况
SELECT education,count(education) as "人数",CONCAT(ROUND(100*count(education)/(SELECT count(education) FROM loan),2),"%") as "人数百分比",COUNT(past_due_days)as "逾期人数",CONCAT(ROUND(100*COUNT(past_due_days)/count(education),2),"%") as "逾期比率"FROM loanGROUP BY education结论:学历为college、High School or Below占贷款人的绝大部分比例,Master or Above贷款人占比及其小,学历越高贷款需求越小,主要客户群体为本科以下学历人员。从不同学历的逾期率情况看,除Master or Above其它三类并无太大差别,但Master or Above数据量太少可忽略不计,所以可以认为,学历高低对逾期情况并无太大影响。
4、3贷款天数比例情况以及不同天数间的逾期率情况(贷款期限选择情况)
SELECT terms as "贷款天数",count(terms) as "贷款人数",CONCAT(round(count(terms)/(SELECT count(*) FROM loan)*100,2),"%") as "百分比",count(past_due_days) as "逾期人数",CONCAT(ROUND(count(past_due_days)/count(terms)*100,2),"%") as "逾期百分比"FROM loanGROUP BY terms结论:贷款天数与贷款人数成正比, 还款逾期天数与贷款人数成正比
5、结论
5、1从贷款规模的角度考虑:贷款客户群体可以更多的关注在受教育程度较低的中青年男性
5、2从安全性角度考虑:适当的多发展女性客户
下一篇:大数据在金融行业的应用
2020-09-29
2020-09-29
2020-09-29
2020-07-30
2020-07-29
2020-07-29
2020年分析6家银行「信用卡」背后的贷款,你知道有多少呢?
2020-07-29
2020-07-29
2020-07-29
2020-07-29