常识
银行中存在的四种卡:
- A:评分卡,申请者评级模型,新用户的主体模型,判断金融机构是否借钱给该用户;B、C、F
- 反欺诈评分卡、申请评分卡、行为评分卡、催收评分卡
信用违约风险概念
交易对手未能履行约定契约中的义务而造成经济损失的风险。
- PD 违约风险
- LGD 违约条件下的损失率
- EAD 违约风险下的敞口暴露
- RWA 风险权重资产
- EL 期望损失
常用特征
- 个人信息:学历、性别、收入
- 负债能力
- 消费能力
- 历史信用记录
- 新兴数据:人际社交、网络足迹、个人财务等
步骤
- 立项:场景、目的、对象
- 获取数据:公司内部数据,其他来源等
- 数据预处理:数据清洗与特征工程
- 模型开发:逻辑回归vs机器学习、单一模型vs集成学习
- 模型检验与评估:区分度、预测性、平稳性
- 验证和审计:是否有计算错误、逻辑错误、业务错误等
- 模型上线:从开发环境到生产环境、容量、并发度等
- 检测与报告:性能是否减弱、是否需要优化等
常用模型
- 逻辑回归
- 优点:简单稳定、可解释、技术成熟、易于检测和部署
- 缺点:准确度不高
- 决策树
- 对数据质量要求低、易解释
- 准确度不高
- 组合模型
- 准确度高、不易过拟合
- 不易解释、部署困难;计算量大