数据治理的三种共享范式

2022-08-30 15:23:35 浏览数 (2)

全文约3000字 阅读约5分钟

数据共享范式的演变,从过度授权的“默认知道”(Default-to-Know),到默认不共享的“需要知道”( Need-to-know),再到默认共享的“需要共享”( Need-to-share)。这些范式,本质上是在数据价值数据风险之间进行取舍和平衡。

众所周知,安全法规和最佳实践似乎经常要求组织将数据锁定,从而限制“需要知道”的员工的访问。然而,数据只有与需要它的人共享时,才有价值。但是,数据的更广泛共享,既需要秉持“需要共享”的原则,又需要采用创新的数据安全方法,如数据安全治理框架数据安全平台

数据共享范式将影响许多数据驱动型组织。根据Gartner的观点,到2025年,30%的Gartner客户将使用“需要共享”方法,而非传统的“需要知道”方法,来保护他们的数据。

组织应该审视:其数据安全策略和数据安全治理框架,是否还停留在石器时代。

目 录

1.杰出数据共享的好处

2.传统数据共享的问题

3.从“默认知道”到“需要知道”

4.从“需要知道”到“需要共享”

5.DataSecOps方法

01

杰出数据共享的好处

杰出数据共享意味着,大量用户可以快速、轻松地访问数据,以便他们可以分析数据使用数据,来改善各种职能(包括客户服务、留存、支持、运营、营销、销售等)的业务成果

杰出数据共享蕴含了数据民主化的理念,使组织内的尽可能多的人能够访问数据,并将其转化为有意义的业务价值

杰出数据共享有以下主要好处:

  • 当组织中的许多数据消费者使用数据时,他们能够快速将数据转化为价值,组织将获得较高的数据投资回报率
  • 当组织拥有杰出数据共享时,数据产品/项目的上市时间和实现价值的时间就会缩短。这可能会对组织的业务结果产生重大影响。
  • 当组织的数据共享运行良好时,组织可以减少数据的瓶颈和排队时间。这使组织的用户(如数据科学家、业务分析师、工程师)更加快乐,并使数据工程和数据治理等团队更加专注于他们的核心职责,而不是手动管理和处理数据访问请求。

02

传统数据共享的问题

数据治理是指监督数据管理的政策和流程。数据治理需要保证数据安全可靠。

传统上,在数据共享方面,组织倾向于“选择加入”(opt-in)方法。这意味着默认情况下数据所有者不与组织的其他成员共享数据

评估过程需要时间。当有其他成员专门请求数据共享时,数据所有者通常会评估共享数据的好处和风险:好处主要是不同类型的业务成果,例如改进的营销、客户服务、运营;风险主要是合规和安全风险(例如不符合监管要求或数据泄露)。而这个评估过程需要时间。

技术启用还需要时间。从数据所有者批准对共享数据集的访问开始,通常还需要额外时间由数据团队(如数据工程、平台和共享数据服务等)在技术上启用共享,才能真正与数据消费者(如数据科学家、业务分析师、工程师等)共享数据。

03

从“默认知道”到“需要知道”

“默认知道”访问模式的后果。很多企业,特别是处于高速增长模式时,都采用“默认知道”的数据访问模式。这意味着以过度授权(甚至是不受控制)的方式访问数据。这种过度授权通常会在安全和合规风险方面产生问题。

总有一天,企业想要缩小这些授权。而缩小这些授权通常是个很费劲的过程。因为公司不得不设置新的安全控制,创建新的流程,应用新的安全策略。而那些之前已经习惯于免费访问所有数据的用户,将只能基于其角色和责任获得有限的访问权限。而这个过程必然是痛苦的,比如:

  • 生产和分析环境中不断变化的安全控制,会带来运营风险和成本。
  • 这个过程需要被具有不同目标的多个不同团队所理解、接受、执行。
  • 这个过程通常很难获得支持,尤其是当业务价值并不总是增长时。一般来说,如果公司不满足某些数据访问控制要求,它们将会达到增长上限。

“需要知道”访问模式。企业的下一步自然是从“默认知道”转变为“需要知道”。这意味着,在转变之前,所有(或大多数)数据消费者都可以访问数据存储中的所有(或大多数)数据;而现在,基于他们在组织中的角色(如客户成功、工程师、营销)和具体职责,他们对数据的访问将受到限制。其他的例子还包括仅限特定团队访问敏感数据、数据匿名化和脱敏,以及应用数据本地化策略。

04

从“需要知道”到“需要共享”

已经看到并且可以预期,已经处于“需要知道”心态的组织,正在意识到,重点应该放在允许组织中更多的数据可访问性上,并保持共享优先的心态。

为了更好地向“需要共享”范式转变,组织需要改变思维方式和行为:

1)从风险厌恶到风险调整

风险厌恶(Risk-Averse)策略。许多组织采用风险厌恶的策略,即先试图缓解所有风险,然后才接受数据共享请求。

风险调整(Risk-Adjusted)策略。但更优的策略是风险调整,即组织直接从数据被共享和处理的位置开始,着手缓解风险。

风险调整策略的一个例子是拥有一个连续的匿名化层,以确保共享的数据被匿名化或脱敏到所需的程度。具有基于角色的脱敏非常重要,这样客户成功团队就可以访问客户的出生日期(即月份和日期),这样他们就可以祝他们生日快乐,但无法访问出生日期字段的年份;而其他用户则根本无法访问出生日期的任何部分,因为他们的工作不需要。

2)从选择加入到选择退出数据共享

选择加入(Opt-In)数据共享:意味着数据所有者默认不共享数据,只是有选择地共享某些数据。这种方式很容易产生数据孤岛

选择退出(Opt-Out)数据共享:意味着数据所有者默认共享数据,只是有选择地不共享某些数据

共享方式转变。从“选择加入”转变为“选择退出”数据共享,意味着组织中的数据默认都是共享的,而数据所有者需要决策的是哪些数据不能共享。

数据访问控制。更加重要的是,数据默认共享隐含了数据访问控制的要求。也就是说,数据所有者以及其他数据干系人(数据治理、数据安全、数据隐私等团队)可以并且应该对要共享的数据(尤其是敏感数据)进行访问限制。

3)从数据所有者手中夺走(部分)权力

数据所有者拥有过度权力。传统上,数据所有者会收到组织中其他团队的共享请求,有时会在与他人协商后决定是否共享数据。他们大多是根据风险与价值的衡量,来做出这个决定。而问题在于,数据所有者通常对风险和价值的看法存在偏见。因为数据所有者和数据创建者通常对共享数据所涉及的风险持有狭隘的观点,而忽视了数据共享所带来的价值。

组织需要剥夺数据所有者的部分权力。剥夺权力的最佳方式,就是采用上面提到的“选择退出”模式,即数据默认都是共享的,而数据所有者只能选择那些不能共享的特定数据集。

4)清晰透明的安全、治理、隐私策略

前面已经提到,在共享数据时,如果不采取必要的控制措施来避免风险,就不可能实现“需要共享”的目标。

要实现这一点,组织需要制定非常清晰的数据共享“参与规则”。这意味着组织需要清楚地了解:

  • 持续了解敏感数据的位置。否则,数据暴露风险可能会压倒数据民主化的愿望。
  • 具备敏捷访问控制的能力。这意味着,即使数据集在整个组织中共享,也只有某些特定组才能访问PII(个人识别信息)。这通常通过动态数据脱敏等方法来实现。
  • 有一个“委员会”(或团队),可以针对数据共享的限制性做出快速决策,并解决冲突。
  • 培训所有数据干系人(在许多数据驱动型组织中,他们可能是组织的重要组成部分),在数据隐私、数据安全、数据治理等方面。

05

DataSecOps方法

在组织内转向更加开放的数据共享策略,非常符合DataSecOps(数据安全运营)理念。换句话说,一个组织要想处于数据民主化的态势,就不得不采用DataSecOps原则,如将安全性嵌入在流程本身中,否则,将无法以自动化方式应用访问策略来获得即时数据访问。

“需要共享”是所有组织处理其数据的恰当方式吗?不,这种方法可能被视为“纯粹数据民主化”。它适用于在DataSecOps方面达到成熟或部分成熟水平的组织

然而,在数据优先经济中,一个高阶的“需要共享”型组织,必然会对“默认知道”和“需要知道”型组织形成“不公平的优势”。

而一个好的数据安全平台,也是一个DataSecOps平台,无论组织采取“默认知道”、“需要知道”、“需要共享”范式的哪一种,都可以帮助组织增强数据访问控制并加速数据价值实现。

(本篇完)

0 人点赞