写点什么

人人用数不用愁,动态数据脱敏为您解忧

  • 2023-11-03
    广东
  • 本文字数:2180 字

    阅读完需:约 7 分钟

人人用数不用愁,动态数据脱敏为您解忧

本文分享自华为云社区《直播回顾 | 人人用数不用愁,动态数据脱敏为您解忧》,作者:胡辣汤 。


随着大数据时代的到来,数据作为重要的生产要素和流动载体,如何加强技术层面的数据安全和隐私保护,对数据仓库产品提出更高的要求。本期《隐私保护不用愁,数据脱敏为您解忧》的主题直播中,我们邀请到华为云 GaussDB(DWS)技术布道师胡玥老师,针对 GaussDB(DWS) 动态脱敏功能、效果与开发者和伙伴朋友们展开交流互动。

什么是数据脱敏?


数据脱敏(Data Masking),顾名思义,即屏蔽敏感数据,对敏感数据通过脱敏规则进行数据的变形。如:身份证号、手机号、卡号、客户姓名、客户地址、邮箱地址等。


数据脱敏分为静态数据脱敏和动态数据脱敏。静态数据脱敏,是数据的“搬移并仿真替换”,是将数据抽取进行脱敏处理后,下发给下游环节,随意取用和读写的,脱敏后数据与生产环境相隔离,满足业务需求的同时保障生产数据库的安全。动态数据脱敏,在访问敏感数据的同时实时进行脱敏处理,可以为不同角色、不同权限、不同数据类型执行不同的脱敏方案,从而确保返回的数据可用而安全。

GaussDB(DWS)动态数据脱敏


当前,业界脱敏实施最广泛的方案是基于数仓底座,外挂第三方代理工具实现脱敏目的,这类方式属于静态脱敏,而 GaussDB(DWS) 数据脱敏是在数仓底座拓展了一个透明引擎与数仓内核直接交互,使得脱敏处理在 SQL 语句请求执行过程中实时发生,然后返回给用户执行结果,即脱敏之后的数据,所以整个脱敏的过程,用户无感知,边执行、边脱敏、边使用,是一种非常典型的动态脱敏。

DWS 动态脱敏引擎的优势


良好的底座协同。脱敏引擎贯穿于数仓底座的诸多环节,基于预置脱敏策略,参与 SQL 引擎的解析、重写、优化与执行。脱敏过程用户无感知。


策略可配置。客户可结合自身业务场景识别敏感数据并对业务表的指定列灵活预置脱敏策略。


策略可扩展。产品内置脱敏函数,可以涵盖大部分常见脱敏效果,支持用户自定义脱敏函数。


数据可用性。数据库内原始敏感数据参与运算,仅在出库时刻(返回结果时)才会做脱敏处理。


数据访问受控。脱敏策略生效条件的用户均对原始敏感数据不可见。


全场景数据不泄露。底座交互,可减少敏感数据传输链路潜在的泄露风险,更加安全可靠,且充分识别各种恶意套取潜在场景并有效防护。


GaussDB(DWS)脱敏引擎

数据脱敏怎么用?


动态数据脱敏,是在查询语句执行过程中,根据生效条件是否满足,实现实时的脱敏处理。生效条件,通常是针对当前用户角色的判断。敏感数据的可见范围,即是针对不同用户预设的。系统管理员,具有最高权限,任何时刻对任何表的任何字段都可见。确定受限制用户角色,是创建脱敏策略的第一步。


敏感信息依赖于实际业务场景和安全维度,以自然人为例,用户个体的敏感字段包括:姓名、身份证号、手机号、邮箱地址等等;在银行系统,作为客户,可能还涉及银行卡号、过期时间、支付密码等等;在公司系统,作为员工,可能还涉及薪资、教育背景等;在医疗系统,作为患者,可能还涉及就诊信息等等。所以,识别和梳理具体业务场景的敏感字段,是创建脱敏策略的第二步。


不同脱敏列可以采用不同的脱敏函数。比如,手机号通常显示后四位尾号,前面用"*"替换;金额统一显示为固定值 0,等等。确定脱敏列需要绑定的脱敏函数,是创建脱敏策略的第三步。


有了上述三个信息,第四步构造策略创建的语句并执行,从而预制好脱敏策略。


常见的脱敏效果

如何做到数据库内可算仅库外不可见


数据库内要求原始的敏感数据能够参与加工计算,仅在出库的时刻敏感数据才会被脱敏处理。例如投影列表达式、投影列函数、聚集函数、过滤条件、分组条件、子查询位置投影列表达式等,需要原敏感数据直接参与加工计算。在表查询、视图查询、COPY 查询、GDS 外表导出等场景触发时会进行数据脱敏。可算不可见功能有一个前置的条件,需要打开开关 enable_redactcol_computable=on!。


示例:将表 emp 中年龄<30 的员工数据生成新表 young,员工 Alice 查看表 young 数据会发生什么?

输入语句:CREATE TABLE young AS SELECT * FROM david.emp WHERE timestampdiff(year, birth, now()) < 30;


SELECT * FROM young;


执行语句后,员工 Alice 查看目标表样时发现查询 young 表的脱敏行为与我们的原表 emp 行为一致(图一)。当我们查看 Alice 表定义时(图二),发现 Alice 并没有手工创建脱敏策略,而是关联了脱敏策略 inherited_rp,INSERT 执行过程触发脱敏策略的继承,从而保证我们的数据库内可算,又保证了数据的隐私性。


图一


图二


华为云数仓 GaussDB(DWS)数据脱敏功能,是数据库产品内化和夯实数据安全能力的重要技术突破,主要涵盖以下三个方面:


  • 一套简单、易用的数据脱敏策略语法;

  • 一系列可覆盖常见隐私数据脱敏效果的、灵活配置的内置脱敏函数;

  • 一个完备、便捷的脱敏策略应用方案,使得原始语句在执行过程中可以实时、透明、高效地实现脱敏。


总而言之,数据脱敏功能可以充分满足客户业务场景的数据脱敏诉求,支持常见隐私数据的脱敏效果,实现敏感数据的可靠保护。欢迎感兴趣的开发者观看直播回放,了解详细信息。


更多关于 GaussDB(DWS)产品技术解析、数仓产品新特性的介绍,请关注 GaussDB(DWS)论坛,技术博文分享、直播安排将第一时间发布在 GaussDB(DWS)论坛。


论坛链接:https://bbs.huaweicloud.com/forum/forum-598-1.html


直播回放链接:https://bbs.huaweicloud.com/live/cloud_live/202310191700.html


点击关注,第一时间了解华为云新鲜技术~

发布于: 2023-11-03阅读数: 3
用户头像

提供全面深入的云计算技术干货 2020-07-14 加入

生于云,长于云,让开发者成为决定性力量

评论

发布
暂无评论
人人用数不用愁,动态数据脱敏为您解忧_数据库_华为云开发者联盟_InfoQ写作社区