数栈是云原生—站式数据中台PaaS,我们在github和gitee上有一个有趣的开源项目:FlinkX,FlinkX是一个基于Flink的批流统一的数据同步工具,既可以采集静态的数据,也可以采集实时变化的数据,是全域、异构、批流一体的数据同步引擎。大家喜欢的话请给我们点个star!star!star!
github开源项目:https://github.com/DTStack/flinkx
gitee开源项目:https://gitee.com/dtstack_dev_0/flinkx
一、数据安全
2018年6月,《中华人民共和国网络安全法》(以下简称:网安法)和《通用数据保护条例》(以下简称:GDPR)生效。
GDPR用法律的力量规定欧盟成员国中实行与个人(个人数据)相关的统一信息治理。为此,条例要求企业加大对信用卡、银行信息及个人健康等数据信息的存储和传输的监控力度,制定数据访问策略,并加强相关审计。
“网安法” 第二十一条:国家实行网络安全等级保护制度。网络运营者应当按照网络安全等级保护制度的要求,履行下列安全保护义务,保障网络免受干扰、破坏或者未经授权的访问,防止网络数据泄露或者被窃取、篡改。
数据安全和隐私保护、数据操作审计,是企业数据资产管理工作的重中之重。
在大规模的数据量管理需求背景下,数据操作审计、数据安全保护等工作必然要通过工具化、产品化、可视化的方式来实现和完成。
袋鼠云数栈作为企业级数据中台PaaS,在数据安全方面开发「数栈-数据地图」套件,具有以下功能特性,目前在很多客户的实际应用中也受到多方认可。
二、数栈如何保证数据安全
数栈通过两种方式对数据进行权限管理:数据权限审批流和数据脱敏。
1、数据权限审批流
「数栈-数据地图」支持表级、字段级数据权限的管理,当用户需要跨项目访问表或字段时,需先经项目管理员审批授权,审批通过后才可以对表进行跨项目访问。
授权审批粒度可以做到字段级,并可细化至具体的DDL、DML操作。同时,授权审批具备有效期的概念,超出有效期后自动取消授权,提升数据访问的安全程度。
2、数据脱敏
「数栈」的数据脱敏管理模块,可以实现用户对脱敏的数据进行各类查询和操作,但不能查看、导出敏感数据的具体内容,实现“可操作,但不可见”的效果。
「数栈-数据地图」支持数据脱敏的配置,管理员仅需指定某个字段需要脱敏,其他无权限用户即无法查询此字段的具体内容。
为了全方面保障数据安全,「数栈-数据地图」支持对数据血缘的实时解析,当用户对敏感数据插入其他表,或进行加工处理后,新的数据依然会保持脱敏状态,防止敏感数据外泄。
用户可在脱敏管理模块中查看某个脱敏规则关联的表、字段信息,并支持对部分表关闭/开启脱敏。
「数栈-数据地图」还支持对脱敏表血缘关系的查看与管理,可对上/下游表的脱敏配置,执行一键关闭/开启。
1)数据脱敏的配置-支持对上下游的表自动设置脱敏
使用数栈进行数据脱敏的配置是非常简单的,用户仅需选择某张表的某个字段,系统可自动根据字段级血缘沿袭关系,对上下游的表自动设置脱敏。
同时支持对部分表进行脱敏的开启和关闭,用户可更灵活的控制脱敏的范围。
2)当数据脱敏后-脱敏数据的查看和使用
数据加密和解密、脱敏等问题,获取的数据已经是加密或者脱敏的,当在界面看到数据内容是脱敏的,例如是:***等,当使用者需要数据时候,是直接使用秘钥就OK,或者其他方式处理呢?
实际上产品的数据脱敏管理模块,可以实现用户对脱敏的数据进行各类查询和操作,但不能查看、导出敏感数据的具体内容,实现“可操作,但不可见”的效果。
为了全方面的保障数据安全,「数栈-数据地图」支持对数据血缘的实时解析,当用户对敏感数据插入其他表,或进行加工处理后,新的数据依然会保持脱敏状态,防止敏感数据外泄。
用户可在脱敏管理模块中查看某个脱敏规则关联的表、字段信息,并支持对部分表关闭/开启脱敏.
支持对脱敏表血缘关系的查看与管理,可对上/下游表的脱敏配置,执行一键关闭/开启。