洞见科技解决方案总监薛婧:联邦学习助力数据要素安全流通
近日,由国家工业信息安全发展研究中心、华东江苏大数据交易中心、国家金融科技测评中心联合主办的《2022 数据要素安全流通论坛——联邦学习专场(二)》成功举办,论坛以「推动创新 交互未来」为主题,探讨数据价值安全、高效流转之道。
洞见科技解决方案总监薛婧作为嘉宾受邀出席此次论坛,并以「联邦学习助力数据要素安全流通」为主题进行分享。
以下为精彩回顾:
DT 时代,隐私计算成为数据安全流通的技术最优解
据 Seagate 和 IDC 联合研究表明,2050 年全球数据量将超过 100 万 ZB,毋庸置疑,人类已从 IT 时代进入 DT 时代。
在 DT 时代,典型特征即是数据量爆增,数据成为「新型生产要素」,正如新型石油一样,怎样真正挖掘出数据价值是当下需要不断深入思考的问题。
在数据要素蓬勃发展、提供便利等优点的同时,也暴露出相应的核心问题——数据安全问题。
在监管层面,欧盟曾发布《GDPR》等相关规定,约束互联网巨头在合理框架内进行数据安全共享,我国也相继颁布《网络安全法》、《数据安全法》和《个人信息保护法》。可以看到,国家在从顶层设计层面约束企业或机构等进行数据共享、挖掘数据价值时需遵守相关法律法规。
那么,如何从技术、实操等层面保证数据交互过程安全、可控、可计量?「隐私计算技术」提供了解决思路,并将原有数据流通方式存在的问题逐个击破。
在技术层面,数据协同应用模式存在三个阶段:1.0 时代——数据包传输;2.0 时代——API 接口;3.0 时代——隐私计算。
在 1.0 时代和 2.0 时代,由于数据具有可复制、可缓存、可转售等特性,随着转售次数的不断增加,数据的价值迅速下降,在原有的数据流通方式下,不论是机构内部进行数据共享还是多方机构进行数据共享,均离不开一个问题——数据一定出私域,即通过数据传输进行交互的方式来实现数据价值。
而在 3.0 时代,通过隐私计算技术,就可以实现「数据可用不可见」,在多方参与下,保证数据不出域,在本地进行相应计算。在隐私计算模式下,可使此前不愿或不敢开放的数据安全开放;实现 API 的全面升级,在保障 API 的效果要求的同时,实现安全共享。
隐私计算技术领域存在三大方向,分别为多方安全计算(MPC)、联邦学习(FL)和可信执行环境(TEE)。联邦学习(Federated Learning)是指一个协同机器学习框架,在多个数据方之间以加密计算的形式共同完成模型的训练。在建模训练过程中,多方之间只传递算法计算的中间结果(如梯度),而无需传输原始数据。
通过联邦学习带来的价值可以归结为三点:数据不出私域;数据价值无损;全局最优模型。
在实操层面,主要采用无第三方模式,可通过两个方式实现。第一,本地明文计算与 MPC(HE/SS)技术相结合;第二,在 MPC 基础算子和函数算子上协同机器学习。
洞见数智联邦平台(InsightOne)技术与应用
洞见科技独立自研的金融级隐私计算产品——洞见数智联邦平台(InsightOne),实现了「MPC+FL」融合引擎、无可信第三方联邦学习框架、分布式信任机制、复杂网络拓扑、多方安全图计算、图联邦学习、场景化算法等关键技术,具备高安全、高可信、高性能、高可用、高兼容、低代码等特点,持续引领隐私计算技术创新与应用发展。
此外,InsightOne 平台获得国家「央行+工信部+公安部+网信办」四部门官方权威安全评测认证,是目前唯一一个全面通过国家金融科技测评中心和中国信通院关于多方安全计算和联邦学习全系列评测的隐私计算平台产品。
但随着各类隐私计算平台的建立,将遇到如何满足「既要达成全局性数据智能,又要保持计算的异构自治」的问题,此时,互联互通则成为「技术最优解」。
由于不同隐私计算服务商的技术架构与算法协议存在差异性,导致「数据孤岛」可能演变为「计算孤岛」,洞见科技创造性地开发出异构平台互联互通底座,使构建全域数据协同的生态网络成为可能。
在异构隐私计算平台中,通过管理系统、算法协议及计算原语的松耦合设计,支持「黑盒」、「白盒」、「灰盒」多种互通模式,进而实现递进式互联互通。
洞见科技成功落地的行业典型案例
基于洞见数智联邦平台(InsightOne),通过隐私计算技术产品与业务场景深度融合,在落地实践方面,洞见科技已积累大量案例。包括某股份制银行信用卡账单分期有效模型、某股份制银行线上渠道信用卡申卡审批模型、基于银政合作的行内企业授信额度预测和某部级隐私计算互联互通生态底座平台建设等案例。
案例一:在某股份制银行信用卡账单分期有效模型案例中,存在两大难题:第一,行方内部数据维度有限;第二,通过 API 查询补充客户标签的方式存在泄露行方大量存量客户信息风险,以及会造成极大的成本浪费。利息收入是信用卡业务主要收入来源,某股份制银行为进一步提升信用卡账单分期业务创收,希望引入更多的外部数据构建信用卡账单分期营销模型,服务于行内现有分期业务的营销决策,提高信用卡账单分期业务营销转化率。洞见科技通过将行内数据与外部数据深度结合,使用联邦学习、多方安全计算技术融合的引擎架构,在无可信第三方的情况下,建立账单分期营销模型,实现最终模型 KS 值达到 40%以上。
案例二:在某股份制银行线上渠道信用卡申卡审批模型案例中,存在两大难题:第一,行方内部数据不足以支撑信用卡申卡风控审核;第二,央行征信系统收录了 11 亿自然人,其中近 5 亿自然人没有信贷记录。某股份制银行希望引入更多外部数据维度来进行联合建模,用于该行线上渠道信用卡申卡风控决策流程,降低渠道引入的信用卡用户信用风险。洞见科技通过将行内数据与运营商、互联网、征信等外部数据深度结合,使用洞见科技为行方搭建的融合引擎架构隐私计算平台,通过内置的多种面向金融场景的算法,建立贷前 A 卡模型,实现最终模型 KS 值达到 40%以上。
案例三:在银政合作的行内企业授信额度预测案例中,需要满足三大需求:一是帮助银行落实对普惠金融业务「两个不高于,三个不低于」的金融支持;二是利用政务数据共享,提高额度等级模型准确率,提高「首贷户」数量,减少提贷、慎贷现象;三是实现当地政府尝试向本地银行扩大信息共享范围,促进中小微企业融资。洞见科技通过将行内数据与政府侧数据有效结合,基于洞见科技面向场景的金融级隐私计算平台 InsightOne,建立企业授信额度预测模型,实现模型准确度提升至 85%以上。
此外,洞见科技还承建了首个部级隐私计算互联互通生态底座平台。在该案例中,洞见科技负责进行隐私计算底座开发及初期三家隐私计算引擎插件的集成,并牵头完成多方异构隐私计算平台互联互通工作。
评论