写点什么

聚焦数据来源、数据质量和模型性能构建小微企业信用画像

作者:易观分析
  • 2022 年 8 月 04 日
  • 本文字数:1733 字

    阅读完需:约 6 分钟

聚焦数据来源、数据质量和模型性能构建小微企业信用画像

易观分析:在发展普惠金融的过程中,银行的风控能力决定着小微企业客群的经营水平,其中的关键因素是如何获得数据、用好数据、管好数据,在解决小微企业融资问题的同时,能够保证资产质量的稳定和不良率的有效压降。易观分析认为,结合客户实际融资需求、客群特征和服务策略实行差异化的信贷评级模式,依托数字技术进行信贷全流程的监测和分析,在数据引入和使用的过程中关注数据来源和维度,提高数据质量和模型性能,建立与小微企业风险特征相适应的评价体系,是解决银企间信息不对称的有利抓手。


目前,小微企业的信用数据来源主要包含几个部分:除了人行征信系统和银行内部自有数据以外,主要集中在政府部门或公共事业部门,其他同业金融机构,还有部分是分散在供应链核心企业,以及互联网企业中的替代性数据。数据来源的分散化、碎片化使银行获取数据的成本高、难度大,加上整个社会信用信息体系尚未完全打通,信息获取的渠道不通畅,彼此之间仍然存在着组织壁垒、数据孤岛的问题。



另外,由于替代性数据的信息采集和处理机制不同、来源复杂,数据的准确性、真实性相对较低,银行出于合规考虑,对数据厂商的选择和合作也更加谨慎;供应链核心企业所掌握的上下游交易数据、产品数据等保密程度高,加上链条各环节数据口径不统一,数据质量难以保证,并且存在大量半结构化、非结构化的数据,造成银行实际可用的数据量和数据有效性不足,也加大了数据治理的难度。


优化建议:


1、探索银政与银银合作,安全合规获取高质量数据


相关的法律法规在要求保护数据安全的同时,也重视对数据的合规开发利用。政务数据和金融同业数据本身的质量高、有效性强,能够帮助银行全面了解小微企业信息,银政、银银合作布局普惠金融,可以形成政府、银行、担保、保险等多方数据安全共享的体系,共同解决小微企业贷款的数据难题。隐私计算“可用不可见”的优势是这个过程中实现数据脱敏、脱密的关键,可以从技术上保障数据流通的合规和安全,满足政府、同业、供应链核心企业等对数据保密性的要求。


可以利用多方安全计算技术加强在信贷业务场景的应用,例如在小微企业信贷业务申请、客户评级、图像隐私保护、黑名单共享、贷款资金流向监测等关键环节,通过在各方部署隐私计算节点,共同完成任务调度。但隐私计算目前还尚未发展到大规模落地的成熟阶段,银行在考虑部署隐私计算平台前,需要结合自身业务特点和 IT 架构进行充分评估和验证。


2、提高数据质量,加强对非结构化数据的利用


在加强数据采集的基础上,需要对数据质量、真实性和合规性做进一步判断和治理。数据治理的关键是建立全行统一的数据标准,构建企业级的数据能力中台,打造数据底座,在数据治理的基础上,推进模块的快速迭代和复用,基于大数据、人工智能技术形成全流程、全生命周期的数据治理方案,结合小微企业的信贷业务场景、合同文本、业务图像等非结构化数据,对原始数据进行解析,融合计算机视觉、NLP、知识图谱技术,通过内容管理进行非结构化数据处理,实现智能搜索、内容安全洞察、内容自动化管理,提升小微企业数据的可用性,盘活数据价值。


3、提升模型性能,在数据有限的情况下充分挖掘数据价值


在数据量有限的情况下,对数据的挖掘、模型的建设变得更加重要,一方面可以利用人工智能的深度学习与知识图谱技术,通过业务规则设置、模型设计去识别、融合、分析自有数据,深度挖掘产业链条上下游企业的关联关系,建立小微企业的关系视图,挖掘风险传导的路径;另一方面可以通过机器学习进行历史数据洞察,分析哪些数据可以更加有效、精准地识别客户,哪些数据具有普遍性,哪些数据只针对特定客群有应用价值,从数据中推导模式来帮助信用模型或业务策略的改善。


声明须知:易观分析在本文中引用的第三方数据和其他信息均来源于公开渠道,易观分析不对此承担任何责任。任何情况下,本文仅作为参考,不作为任何依据。本文著作权归发布者所有,未经易观分析授权,严禁转载、引用或以任何方式使用易观分析发布的任何内容。经授权后的任何媒体、网站或者个人使用时应原文引用并注明来源,且分析观点以易观分析官方发布的内容为准,不得进行任何形式的删减、增添、拼接、演绎、歪曲等。因不当使用而引发的争议,易观分析不承担因此产生的任何责任,并保留向相关责任主体进行责任追究的权利。

发布于: 刚刚阅读数: 2
用户头像

易观分析

关注

易观分析让技术创新与应用不再困难! 2022.01.18 加入

易观分析是中国数智化领域专业的科技和市场分析机构。

评论

发布
暂无评论
聚焦数据来源、数据质量和模型性能构建小微企业信用画像_数据技术_易观分析_InfoQ写作社区