利用MYSQL分析《Loan Data》

首页 > 科技 > 大数据 > 正文 2020-09-29

发表自话题:怎样快速找到贷款人群

1、数据准备

下载的数据《Loan Data》,从这份数据里分析出贷款人的基本信息,以便为之后贷款客户的选择做出规划.

链接:

/s/1Kuw9MA6d_HXbbYnGtCnKzg

提取码:b13j

《Loan Data》:loan_ID(贷款ID)、loan_status(贷款状态)、Principal(贷款金额)、terms(贷款期限)、effective_date(开始时间)、due_date(到期时间)、paid_off_time(还款时间)、past_due_days(逾期天数)、age(年龄)、education(教育水平)、gender(性别)

2、提出几个问题

1、贷款人群中男女性别比例情况以及不同性别间的逾期率情况

2、贷款人群中学历分布以及不同学历间的逾期率情况

3、贷款期限选择情况

3、数据清洗

查看数据源:

可以看出数据有500条。

3、1 重复值

查看有无重复值

如图,使用

SELECT DISTINCT Loan_ID FROM loan;

查询loan_id 不重复的数据,结果有500条数据,故无重复值

3、2 缺失值

使用代码,查询

SELECT count(loan_id) FROM loan;

结论:可以看出男性贷款人数和比率比女性贷款的高得多,男性贷款人逾期百分比也比女性的高

4、2 贷款人群中学历分布以及不同学历间的逾期率情况

SELECT education,count(education) as "人数",CONCAT(ROUND(100*count(education)/(SELECT count(education) FROM loan),2),"%") as "人数百分比",COUNT(past_due_days)as "逾期人数",CONCAT(ROUND(100*COUNT(past_due_days)/count(education),2),"%") as "逾期比率"FROM loanGROUP BY education

结论:学历为college、High School or Below占贷款人的绝大部分比例,Master or Above贷款人占比及其小,学历越高贷款需求越小,主要客户群体为本科以下学历人员。从不同学历的逾期率情况看,除Master or Above其它三类并无太大差别,但Master or Above数据量太少可忽略不计,所以可以认为,学历高低对逾期情况并无太大影响。

4、3贷款天数比例情况以及不同天数间的逾期率情况(贷款期限选择情况)

SELECT terms as "贷款天数",count(terms) as "贷款人数",CONCAT(round(count(terms)/(SELECT count(*) FROM loan)*100,2),"%") as "百分比",count(past_due_days) as "逾期人数",CONCAT(ROUND(count(past_due_days)/count(terms)*100,2),"%") as "逾期百分比"FROM loanGROUP BY terms

结论:贷款天数与贷款人数成正比, 还款逾期天数与贷款人数成正比

5、结论

5、1从贷款规模的角度考虑:贷款客户群体可以更多的关注在受教育程度较低的中青年男性

5、2从安全性角度考虑:适当的多发展女性客户

标签组:[贷款逾期] [贷款人] [mysql

上一篇商业贷款按贷款期限分类有哪几种 都适合什么人群

下一篇大数据在金融行业的应用

相关阅读

相同话题文章

相关话题