大数据征信学习与思考
关于信用评估
信用由你的过去决定,未来决策也影响你的信用。
关于企业征信与个人征信
企业征信难于个人征信。企业由于对利益的诉求,往往在信用造假上更愿意冒险。
中小企业征信难于大型企业征信。中小企业信用数据信息更为匮乏、离散。
关于数据征信的输入输出
数据源
数据验证
- 实名验证(身份证拍照)
- 学历信息(学信网)
- 手机实名验证
- 银行卡实名验证
- 人脸对比
黑名单
- 法院黑名单
- 金融黑名单(银行,P2P,小贷)
授权数据
- 申请注册信息
- 消费画像
- 乘机记录(航旅纵横,12306)
- 央行信用报告
- 通讯信息(通讯记录、通讯录、短信)
- 电商消费(淘宝,京东等)
- 银行流水,信用卡流水
移动数据(基于移动设备)
- 手机号码
- 手机设备ID,设备属性
- 常见地理位置
- 通讯信息(通讯记录、通讯录、短信)
- App使用信息
- 网络信息(需要虚拟代理)
模型
模型特点
- 多场景模型
- 多维度模型
- 级联模型(多源数据Mapping后的关联分析模型)
模型支撑
- 逻辑回归+机器学习(算法支撑)
- 真实贷款数据(数据支撑)
- 国内外行业经验+专业经验(经验支撑)
反欺诈
- 多重借贷(有利益诉求时候,往往会有刷信用,跨利益集体的复合借贷)
- 反欺诈规则
技术支撑
- OCR,爬虫(主要适用于公开数据爬取与授权数据读取)
- 规则引擎,知识图谱(迅速寻找数据变量之间的关联)
信用报告
反馈评估结果
- 模型评分
- 审批建议
- 额度建议
- 利率建议
- 久期建议(借贷周期)
小结
关于征信、金融业务,还有许多重要环节,例如放贷类业务的催收环节。不过核心的路径,有个取巧方式,可以从行业中各个公司的用户协议获取一些关键信息 🙂