课程名称
金融数据分析第二期学习视频,资源教程下载
课程介绍
《金融数据分析》第二期
主讲老师:
田野
毕业于新加坡国立大学统计系,曾在外资银行总部和国内领先的咨询服务公司从事模型 开发工作,包括营销模型、信用风险模型等。擅长机器学习的常用算法在营销和风控等实际领 域的应用。擅长的数据分析语言有R,SAS和Python。此外,对银行客群的行为分析也有丰富的相关经验,包括流失预警和消费预测等业务场景。
课程简介:
在金融行业中,营销部门和风控部门是两大主要业务部门。本课程将介绍数据分析技术如何应用在银行业营销部门面临的客户分群需求和互联网金融行业风控部门涉及到的信贷违约预测。 课程中将使用贴近真实业务场景的数据,并且给出切实可行的解决方法。
更新说明:
在本期课程中,我们将实用真实的业务数据,介绍营销工作中常面临的客户聚类分析,和风控中的 (贷中)行为评分卡模型,从而实行客户的精准分类和有效的风险控制。
面向人群:
1. 对金融业感兴趣,想从事银行业、互联网金融行业风控或营销业务。
2. 金融行业数据分析从业人员,并且有一定的数据分析基础和编程能力的学员
学习收益:
1. 熟悉金融行业业务,助力快速适应金融行业数据分析
2. 掌握客户营销中的客户分群的建模方法
3. 掌握风控业务中的违约预测技术,熟悉构建怎样的特征和模型来降低信贷业务中的违约损失
开课时间:
2017年7月20日
学习方式:
在线直播,共10次课,每次2小时
每周2次(周二、周四,晚上20:00 – 22:00)
直播后提供录制回放视频,可在线反复观看,有效期1年
课程大纲:
第一课:数据分析基本知识复习(2课时)
1. 数据分析的基本概念
a. 目的
b. 数据获取和清理
c. 数据的描述性统计与可视化
2. 数据分析的常用模型
a. 监督式模型:(广义)线性回归,决策树,随机森林,支持向量机,神经网络
b. 非监督式模型:聚类分析,因子分析,主成分分析
第二课:银行信贷客户的聚类分析-非监督式聚类(2课时)
1. 数值型变量的归一化
2. 类别型变量的编码
3. 距离的概念和种类
4. 闵可夫斯基距离
5. VDM(Value Difference Metric)距离
6. 聚类的性能度量
7. K-均值算法的难题:如何选取k
第三课:银行信贷客户的聚类分析-非监督式聚类(续)(2课时)
1. 数据描述
2. 数据预处理的实操:归一化与编码
3. K-均值算法用于信贷客户的聚类分析
4. 层次聚类法用于信贷客户的聚类分析
第四课:银行信贷客户的聚类分析-半监督式聚类(2课时)
1. 半监督聚类
a. 约束K-均值算法
2. 带有少量标签的K-均值算法
第五课:行为评分卡模型的简介(2课时)
1. 个人信贷产品的简介及其中的各类风险
2. 什么是评分卡模型
3. 信用风险领域的评分卡模型
a. 申请评分卡
b. 行为评分卡
c. 催收评分卡
4. 评分卡模型的时间窗口概念
a. 表现期
b. 观察期
5. 拓展:PD模型与巴塞尔协议
第六课:行为评分卡模型的特征构造(2课时)
1. 训练集和测试集的划分
2. 特征构造
a. 逾期类型特征
b. 还款率类型特征
c. 使用率类型特征
d. 消费类型特征
e. 其他类型特征
3. 变量的分箱和WOE计算
第七课:行为评分卡模型的特征挑选(2课时)
1. IV的概念
2. 单变量分析
3. 多变量分析
4. 线性相关性
5. 多重共线性
第八课:行为评分卡模型的逻辑回归模型(2课时)
1. 逻辑回归模型的基本概念
a. 什么是逻辑回归
b. 逻辑回归中的参数估计
c. 逻辑回归的正则化:LASSO(L1约束) & Ridge(L2约束)
2. 用逻辑回归构造行为评分卡模型
3. 从概率到分数
第九课:行为评分卡模型的验证、监控和调优(2课时)
1. 评分卡模型常用的评价指标
3. 模型监控的概念
a. 模型监控的频率
b. 模型监控的解读
4. 模型的调优
第十课:组合评分卡模型(2课时)
1. 组合模型概述
2. 串行结构的评分组合模型
3. 异态并行结构的评分组合模型
4. 同态并行结构的评分组合模型
常见问题:
Q: 本门课程需要什么基础 ?
A: 了解线性代数,微积分,概率论与数理统计,以及有一定R/Python编程基础
Q: 课程中使用的软件工具是什么?会提供课程中使用的代码吗?
A: 课程中使用工具为R/Python 2.7,会提供代码
评论0