写点什么

索信达控股首席科学家张磊:人工智能在银行业的应用

发布于: 刚刚
索信达控股首席科学家张磊

3 月 18 日,索信达控股首席科学家张磊博士受邀出席“2021 中国零售银行高峰论坛”并发表演讲。

现场反响十分热烈,当主持人介绍到张磊博士曾带领团队完成了 30 多个大型数据挖掘和数据仓库项目、完成 50 多个数据挖掘专题,建立模型超过 100 个……还没正式开讲就有人对着履历介绍开始拍照;开讲后,整个演讲内容精彩纷呈,掌声不断!会后主办方《零售银行》杂志对张磊博士发出专访邀请;中场休息,索信达展台前来结识张磊博士,请教问题以及咨询索信达产品、业务的客户络绎不绝。为给没有亲临现场的你弥补遗憾,小编特别把张博士的演讲内容整理出来。绝对干货,记得收藏阅读哦~~~

张磊博士的演讲 PPT,请在关注索信达控股,点击”阅读原文“获取——

就 AI 技术如何融入到银行的日常业务中,张磊博士总结为“四大能力、八类应用”,并与近 400 名来自金融机构的中高层领导和专家分享了一个实际的 AI 应用案例,引起大家的共鸣。


助力银行业发展的人工智能四大能力

人工智能这个话题很火,如何和银行业务需求打通,把人工智能技术移驾到银行业本身,这是很多银行客户都很关心的问题。以下是张磊博士总结构建自身人工智能能力的“四大能力”:



第一,业务能力:以业务能力为出发点,所有技术都要解决业绩问题。梳理出金融行业可以用 AI 解决的业务问题,如市场营销、风险管控、财务人事、运营绩效相关的,针对问题进行归类就可以圈出银行业用人工智能数据分析解决问题的范围。

第二,数据能力:以数据为基础,各种数据加工能力为手段,将数据利用起来。人工智能技术和其他的技术有一些不同,它完全依赖数据,若无数据支撑所有先进算法都无作用,所以要有数据储存、加工的能力。

第三,分析能力:以各种先进算法为工具,发现数据中蕴含的有价值的规律。算法的类型像机器学习、自然语言处理、图分析、图计算等,这些算法目前在金融领域用的比较多。第四,思维能力:帮助企业构建分析思维能力,更加合理有效地发现和解决问题。这点要特别强调!因为总被忽视,很多人掌握了技术也知道业务能力,但是还是解决不了问题,因为缺少思维能力。如何将梳理好的数据、算法、业务问题贯通起来,这就需要分析思维能力。


银行业务问题的分类体系与 AI 技术的对应关系

银行业面临的业务问题主要分八大类:

  • 分类问题,将输入样本分类到对应类别中。判断客户质量,购买意愿。

  • 估值问题,根据输入信息估算某个指标的数值。如,某家分行下个月存款余额会到多少?

  • 聚类问题,根据实例的相似度进行归类,银行有上亿客户,想将其分成不同的客户客群,还有网点、支行等的分行也是聚类问题。

  • 优化问题,基于目标函数和约束条件生成最优解。如,我有预算 100 万如何将其花出去达到最大效益?

  • 异常侦测,发现异于常规的实例。如,一笔金融交易是否有问题,是否是欺诈交易,账户间互相的联动是否是洗钱联动。

  • 评级问题,对实例进行排序评级,像信用评级是标准问题。

  • 推荐系统,生成下一步的最佳行动建议。

  • 数据生成,基于已有的数据分布仿真出类似数据。

通过调研可以清楚看到,八类问题的重要程度和价值回报也各有不同。


银行业使用的重点分析技术

银行业会用到很多分析算法,最常用的重点技术包括:随机森林、前馈神经网络、回归分析、分类器、聚类、统计推断、循环神经网络、强化学习。图中越深的颜色代表使用频率较高。



分析专题和数据类型有一定的对应关系,张磊博士认为,无论是做潜客获取或是智能客服或反欺诈、现金库存优化等都是人工智能可以大显身手的领域。


在银行业,AI 应用需要重点关注回报最大的业务领域

对于银行业来说,AI 应用需要重点关注回报最大的业务领域。盲目地做人脸识别或文档 OCR 等无法带来明显的业务价值。其中获得回报最大的是市场营销,其次是风险管控。



建立模型工厂,打造五库合一的分析模型生产流水线

索信达打造五库合一的分析模型生产流水线,通过模型工厂,帮助企业进行数据分析建模的现代化生产流水线。它融合了分析建模生产所需的全部装备,做到五库合一:模型库、模板库、代码库、知识库、课件库。只需装填数据原材料,即可自动化生产出可用的标准模型,同时支持个性化定制。

将八大类问题梳理了 50 多个专题,通过大量实践发现它成型的套路,比如要做资产提升大概分为 7 个步骤可以分析出来,要做反欺诈可以做 9 个步骤分析出来,索信达希望通过构建金融业的模型工厂,把银行遇到的每个问题都可以标准化自动化解决。



12 步搭建客户微细分模型,客户名单命中率最高可提升 75%!

银行通常不会把客户分的很细,10 到 20 群就算多了。假如一家银行有 1 亿客户,分成 10 群,每群 1 千万人左右,把这些客户交给客户经理,他什么都做不了,因为他不可能 1 个人负责 1 千万客户;这种是战略细分,从全行角度分为几大类客户,但是对于战术层面还是没有用处。如此看来客户细分对业务似乎帮助不大?其实是由于细分做的比较宏观、粗放,需要把客群分的更细!所以要做“微细分”,分成几十群、几百群,甚至几万群。

客户微细分是什么?

通过将结构化数据进行合理的图像化,并创新地运用深度学习算法,挖掘反映客户资产偏好的深层特征,从而有效提升银行现有各个模型的准确性,并通过客户在不同图像状态之间的转移概率,预判出客户资产配置的发展趋势,为一线客户经理提供覆盖全客户的营销方向。

通过引入客户微细分产生的新图像特征,将上线模型(大额存单、结构性存款)前 10%名单的命中率提高 20%~40%;无论采用何种预测算法,模型均有明显提升,前 5%名单的命中率最高提升 3/4;直接产生的营销效益高达数百万至上千万。


基于深度学习的客户微细分分析建模流程



客户微细分,是运用算法把客户数据变成图像,以更加细致、更加创新的模型为客户精准画像,给银行业务的开展带来更有价值的决策依据。客户微细分的全部流程分为 12 个步骤,这是个思考、模拟、反复验证的过程,很是有趣。

第一,以数据图像化为桥梁

人工智能近年来比较火的是深度学习,但深度学习算法主要是做图像识别,适合处理图像,而银行基本上都是结构化数据,例如账户数据、交易数据等,结构化数据无法直接被深度学习算法所用,需要借助数据图像化,把结构化数据变成合理的图像就可以用到这个技术了。

第二,客户的产品资产结构化数据

先来看银行最典型的数据,比如我们拿到了 500 万富裕零售客户过去 12 个月的数据,AUM 月日均超过 5 万以上,数据量是每月 500 万客户,包含的字段信息有 AUM、活存余额、定存余额、基金余额、理财余额等。

第三,数据标准化与离散分箱

下图列出 5 条客户数据,每位客户给出了各项产品的余额。比如第一个客户活存 11.8 万,定存只有 1767 元,这是银行常见的数据,数据拿来后会先做标准化,因为一个客户活存余额有 10 万并不一定代表这个客户喜欢活存,如果他的资产有 1000 万,把 900 多万放在定存 10 万放在活存,显然不能说明他喜欢活存。


第四,相关分析

接下来我们希望将这个数据变成一幅图,才能使用图像识别技术。这个数据可以变成瓦片图,按照比例高低,最高的放在最左边,但是瓦片图最大的问题是没有考虑产品之间的关系,只是简单按照数字大小排。如何把产品之间的关系引用进来呢?比如说理财和基金是不是有互斥的关系。通过相关分析,就可以看出变量之间的相关性是正相关、负相关,哪些相关系数强或弱。

第五,太阳系与万有引力定律

算出相关系数之后,再来看如何改造前面得到的“瓦片图”。张磊博士联想到太阳系九大行星,地球、金星、火星围绕太阳转,这之间的轨道不是很快形成的而是慢慢形成的,是星球间的万有引力才使其形成的,所以运用这种“引力”定位行星的运行轨道。我们只需将活存、定存、国债、基金、理财这些产品视作星球,将彼此间的相关系数视作引力,就可以通过迭代来构造出产品的星系图。

第六,网络布局算法与斥力模型

运用斥力算法,把一堆产品想象成一堆球丢在桌上,相互之间会有引力斥力,当斥力达到平衡时得到最终结果。活存和理财离的比较近代表比较相关,贵金属离的比较远,则相当于很遥远的冥王星。现在可以发现我们已经将刚才的数据变成更有意义的图像了,但这个时候还不适合做深度学习。如果现在是把 100 张这样的图摆在你面前,你一定会看的眼花缭乱,但是如果把瓶子或椅子放在这里,离 100 米就能看出大概什么区别,是因为从其轮廓上很自然就能识别出来。目前的图像还没有鲜明的轮廓,所以需要对这些图进行改造。



第七,等高线投影与颜色映射

可以把这些小球想象成一个个山头,可以看到这些山头高高低低的,高高低低的山峰如果想画到二维上通常会用等高线,于是把一堆球变成一堆山峰,再变成一些二维等高线,就得到最开始我展示的那张图。中间最红最亮的就是客户最关心的产品如活存、理财、定存。



第八,一人一图像百花齐放

下面罗列了 20 张图,有一些图比较类似,比如说倒数第二列第一行第二行,像两块石头堆在一起。有的客户很不一样,有的客户很类似。例如,左上角这个客户只有一块亮就是定期存款,右下角这个客户是重财惜命型,他的资产主要放在人身险和财产险;还有的客户是惜命爱基型,财产放在人身险和基金;再是贷款型以贷款为主,少量活存,大量资产放在贷款,另外有一定的活期存款用来还款;还有白领型,活存和薪金煲为主,其次是人身险,该客户是标准的代发工资客户,工资发下来后会买薪金煲,同时还会买基金,收入应该不会太低,还会买人身险。什么样的代发工资客户在这家工资用信用工资做理财还买人身险,通常来说收入水平会达到一定水平。



第九,图像的自动特征编码

很多图做出来发现比较类似,所以很自然会想到把类似的图像聚类在一起。图像聚类通常会采用自动编码器,算法的输入是这张图像,输出还是这张图像,中间做压缩编码和解码,用几个数字来表示这张图像的主要特征。

第十,密度聚类为客户微状态

把图像变成数字特征后就可以采用聚类算法进行聚类,把类似的图像聚到一起,最开始我们采用的是 AP 算法,但是效果太慢,后来又换成了密度聚类算法,原来跑的 AP 算法大概跑 40 多分钟,但是换了 DBSCAN 算法只需要 6 秒,把类似的图放在一起,就聚成了 1616 个个类。

第十一,状态随时间的转移概率

聚类效果还不错,类中心的代表性比较强,由此就得到了 1616 个微细分群。如果把每一个微细分群看成一个状态,可以发现每个月客户的状态在不断地变,大部分时候变的很慢,从一张图变成另一张图有业务的含义,先是日常消费,然后尝试买理财,然后申购基金办理理财卡。

第十二,状态转移全景图

索信达将状态演变做成动画,看起来很炫,但是实际有没有用,是否有业务价值呢?张磊博士进行了验证,如果这个图画的比较有意义,用来进行营销应该能带来帮助。银行以前做了结构化存款的响应预测模型,用常规数据丢进去跑一个模型,现在我们用客户微细分之后得到更多的图像特征,如果有提升就代表有价值,最后验证结果是前 5%的名单命中率提高 25%,前 10%名单命中率提高 14%,验证了产生的这些图像特征可以给业务明显帮助。



金融机构可以通过“客户微细分”的深度学习模型,来分析自己的客户群体,找到类似群体之间的细微不同,从而提供更加私人定制般的客户服务,以此来优化成本结构,完成自己的价值主张、打通自己的渠道通路、拓展自己的收入来源、优化自己的核心资源。

人工智能是银行业把握科技变革对商业社会重塑的奇点性机遇,重新认知和构建银行的生态和企业价值链,重塑银行与社会和客户的链接。索信达将会携手中国银行机构共同把握未来银行的机遇。

发布于: 刚刚阅读数: 2
用户头像

索信达控股(股票代码:03680.HK) 2021.05.20 加入

索信达被誉为港股金融AI第一股。核心团队和研发团队全部来自SAS、Teradata、FICO、德勤、毕马威、安永等,天然具有世界级产品厂商的血缘和水准及专业服务能力,是中国金融行业AI大数据、整合智能营销领导者。

评论

发布
暂无评论
索信达控股首席科学家张磊:人工智能在银行业的应用