写点什么

基于二代征信报告的信用评估模型实践

作者:中关村科金
  • 2023-04-04
    北京
  • 本文字数:3202 字

    阅读完需:约 11 分钟

关于二代征信报告


自 2020 年 1 月 19 日起,二代征信系统正式上线,中国人民银行征信中心向社会公众和金融机构提供二代格式信用报告查询服务。与一代征信系统相比,二代征信系统在收录数据、信息更新、信用分计算、用户权益保护等方面有所改进。


目前,二代征信报告主要涵盖个人基本信息、信息概要、信贷交易信息明细、公共信息明细、本人声明、异议标注及查询记录这八个部分,基于这些信息可以更全面地展示金融客户的信用状况及历史信用行为,为金融该机构提供业务决策依据。二代征信中丰富的数据为变量衍生、授信模型、风控策略的优化迭代提供了支撑,辅助金融机构精准洞察客户需求、构建客户画像,辅助信贷审批,提升风险防控水平,更好地为金融客户提供服务。


应用价值

二代征信报告,在金融领域的应用价值

随着银行、信托、消费金融公司、汽车金融公司等各类金融机构相继接入二代征信系统并加入报送行列,其覆盖率、普及率以及数据质量越来越高,二代征信报告的应用价值日益增长。二代征信报告在金融领域应用广泛,为金融机构提供了更权威、易得、易用的客户信用数据,为促进金融交易、降低金融风险、提升社会信用意识提供支撑。


提升风控能力:二代征信报告在金融信贷业务风控环节上可以应用于信用评估、风险识别、欺诈识别、风控模型搭建等方面,通过数据挖掘、数据分析、变量衍生等技术手段实现征信数据的最大化挖掘利用,进一步完善风控模型或授信策略,有效提升业务审批质量,规避潜在业务风险,保障金融体系良性发展。


降低运营成本:二代征信报告为金融机构提供权威可信的信用数据,有效降低了企业融资成本和金融机构信贷业务审核成本,提高业务管理及运营效率。另一方面,也为资信良好的用户缩短审批时间,实现秒批秒贷,升级用户体验。


提升贷后管理工作质效:基于信用评估模型融合二代征信报告数据能有效衍生多维特征变量,有助于形成更精准的贷后评分卡,为差异化、个性化的催收策略提供支撑,保障贷后管理工作质量及效果最大化。因此,对于二代征信报告信息的深度挖掘对于金融机构提质增效具有重要价值。


不过,目前国内二代征信报告的读取形式较为单一,缺乏丰富的特征变量体系,现有信息数据也无法直接用于业务场景。需要依托 AI 能力对征信数据进行深入挖掘分析及变量衍生,构建系统化的征信特征变量算法库以及 AI 模型,实现智能化、自动化的运营优化、风险决策、营销分析,支撑金融机构智慧转型。


技术探索

基于二代征信报告的信用评估模型实践

作为国内领先的对话式 AI 技术解决方案提供商,中关村科金充分挖掘科技在金融场景下的深度赋能,帮助金融机构提升服务质效、防范金融风险,以数智化的产品及服务助推消费金融行业行稳致远。自 2020 年二代征信报告正式上线时起,中关村科金就开始针对征信数据报告进行挖掘和加工,搭建衍生特征变量算法库,实现变量开发配置化,充分利用征信数据在信贷业务中的风控及营销等环节提供辅助业务决策的技术方案。


例如在风控领域,中关村科金将二代征信数据与三方渠道数据融合,通过从场景适配、模型搭建、系统支撑、贷后管理等方面入手,帮助金融机构加强自主风控能力,满足监管合规要求,实现对消费金融细分业务场景下的精细化风控。


营销领域,通过构建信用评估模型、客户流失模型、客户画像等,为金融机构开展存量客户经营、交叉营销提供策略支持,有效降低客户流失率、提升营销转化率。


万维变量库:全面覆盖信贷业务风控需求


中关村科金利用样本优势和对二代征信数据的深度挖掘分析,积累了丰富的模型服务经验,建立了基于征信数据开展风控服务的优势,借此开发了服务于海量金融客户的征信报告解析程序,将非结构化的报文数据转化为结构化数据,在此基础上开展数据挖掘与变量衍生。


变量衍生的方法包括自动化衍生方法和基于业务经验的衍生方法。自动化衍生方法是指利用特征升维方法,比如决策树类、神经网络类算法,对原始变量进行组合和计算,或者利用第三方的升维框架,对原始变量字段进行加、减、乘、除等多种运算;再按照应用场景对变量进行筛选,首先利用缺失率、众数比例和 PSI 等指标进行筛选,然后利用 IV 进行筛选,选择出对特定场景有效的变量入变量池。


基于业务经验的衍生方法是指按照对业务的理解,对特定时间切片内用户的申请、用信、还款和逾期等各个信贷行为发生的频次、额度、比例等进行计算,期望产生对于预测客户的信用情况或贷后管理工作有效的变量。例如,对二代征信报告中的信贷类信息,可按照衍生逾期及违约信息、授信及负债信息、还款历史和期数信息、贷记卡账户信息和反欺诈信息等细分类别进行进一步的衍生。一般而言,基于业务经验开发的变量效果好于自动衍生框架产生的变量,而自动衍生框架有助于扩充可用变量库。


截至目前,中关村科金累计开发了上百个风控模型,二代征信变量库规模已经突破万维,沉淀的专家变量已达数百个。这些变量可以基本覆盖金融信贷场景下的贷前、贷中、贷后风控建模需求。


信用评估模型:捕捉优质客群 助力业绩增长


中关村科金在变量库的基础上开展了征信模型开发及迭代工作,逐步形成了二代征信模型标准化产品,涵盖面向消费信贷、车贷等场景下的信用评估模型。


该系列信用评估模型集成了 HTML 或 XML 报文解析、数据结构化、变量衍生计算和模型预测功能,可帮助客户实现从接收报文到产生决策依据的一站式服务。通过输出[0,1000]范围的评分值,此预测评分可直接供给下游决策引擎,供用户开展贷前风控或贷中客户风险动态监测使用。


从基于时间切片、总额、比例、查询等衍生策略产生的上万个变量中选取数百个高 IV 或高覆盖率变量入模。针对银行、消费金融等业务场景下的不同客群,以及不同风险表现周期,结合 XGBoost、LightGBM 等机器学习算法实现定制化分析建模。经验证,银行客群模型效果最优,KS 均在 0.35 以上,AUC 在 0.70 以上,和一个融合类信用分产品结合使用时,KS 可升至 0.4 以上,风险识别效果提升 30%+。


为缩短客户投产时间,该系列信用评估模型采用了 Springboot 框架开发,封装了报文解析、变量衍生和预测模型等功能,使用时将原始征信报文通过接口输入,即可通过返回获得长期风险和短期风险的信用评分。模型产品各个模块采用松耦合设计,可按照客户需求裁剪标准产品中包含的组件,以定制版进行交付。


中关村科金信用评估模型基于真实的消费金融业务样本,面向下沉客群,经过多个版本的迭代后形成了具备稳定性的可交付产品。

实践案例

助力金融机构实现 200%的资产规模增速

在标准模型基础上,中关村科金针对信贷业务场景开发了匹配业务需求的定制化征信模型。这一模型同样以征信变量和部分申请人的基础信息作为输入,无需三方数据源,可独立工作。支持按照客户要求,将模型输出由数字化的评分映射为 5 个或 10 个风险等级,便于用户根据模型输出开展业务决策。该模型产品以服务包形式进行交付,可在客户环境中实现快速部署及投产,最大程度提升金融业务决策效率。


征信数据应用流程


目前,中关村科金信用评估模型该模型已经成功服务于银行、保险等多家金融机构。中关村科金依托自研的信用评估模型,为客户提供从报文到信用评分的全流程数智化处理,跳过变量落库开发,打造基于征信数据的短期风险模型和长期风险模型。依托征信模型精确量化申请人的信用风险、支撑信贷审批决策、强化风控体系,有效支撑该企业实现业务增长,其资产规模增速达 200%+。


此外,在风控场景中,中关村科金以该模型为基础,利用客户的少量样本对该模型进行迁移训练,并按照金融机构要求对输出结果做调整,可输出分数或客户分级。例如在车贷场景中,基于中关村科金的信用评估模型可以针对客户信用风险进行精细化分级,最高支持 10 级分级,而常见的风险模型仅支持 6 级分级,更细致的分级有助于帮助金融机构更好的捕获优质客群。经验证,应用中关村科金信用评估模型进行业务决策,其优质客群逾期率、迁移率等关键指标明显降低,助力金融机构业绩增长。


作者:李国庆 中关村科金人工智能资深产品专家

用户头像

还未添加个人签名 2020-07-20 加入

还未添加个人简介

评论

发布
暂无评论
基于二代征信报告的信用评估模型实践_金融_中关村科金_InfoQ写作社区