大数据管理概论

2022-06-28 17:11:01 浏览数 (1)

大家好,又见面了,我是你们的朋友全栈君。

大数据管理概论

  • 1 大数据隐私
    • 1.1 引言
      • 如今的数据主要大数据的类型
      • 隐私特征与类别
      • 大数据的隐私风险
    • 1.2 隐私保护技术
      • 匿名化技术
      • 数据加密技术
      • 差分隐私技术
      • 隐私信息检索技术
    • 参考文献

1 大数据隐私

1.1 引言

  • 21世纪网络技术的发展使得个人的隐私无处可藏

如今的数据主要大数据的类型

1)原生数字化数据 这类数据自然产生出来就适合计算机存储的和处理的数据。例如:电子邮件与文本信息,GPS位置数据,关联电话呼叫的元数据等等,这类数字化的数字信息可以被计算直接利用 2)原生模拟话数据 这类诗句一般为非结构话的数据,例如呼叫的音频与视频,个人健康数据,环境监测数据,超声波检测数据

隐私特征与类别

隐私的类别主要分为以下三类: 1)监视带来的隐私 2)披露带来的隐私:这类隐私是指故意或者无意中想不可信的第三方透露或者遗失数据。该类隐私通常利用匿名化,差分隐私,加密和访问空指技术来保护 3)歧视带来的隐私:大数据处理技术不透明,普通人无法感知和应用,会在无意有意中产生歧视结果

大数据的隐私风险

大数据处理框架

泄露

数据收集

例如在网上搜索医院时,会首先推荐附近医院。

数据集成与融合

在完整服务用户时,收集来自用户各类的消费记录,即使采用了模糊话,匿名化的操作,用户的信息还是容易被攻击者获取到

数据分析

分析用户的各种信息很容易就泄露数据的隐私

数据解释

1.2 隐私保护技术

匿名化技术

匿名化是指隐藏或者模糊数据以及数据源。该技术一般采用抑制,泛化,剖析,切片,分离等操作匿名化。有K-匿名,l-diversity,t-closeness

数据加密技术

大数据隐私通常以云平台为依托,实现隐私管理。主要有同态加密,功能加密,安全多方计算等,安全多方计算核心操作是在分布式环境下基于多方参与者提供的数据计算出相应的函数值,并确保除了参与者的输入以及输出信息外,不会额外暴露参与方的任何信息。

差分隐私技术

参考差分隐私技术

隐私信息检索技术

参考文献

[1]孟小峰.大数据管理概论[M].机械工业出版社,2017

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/132697.html原文链接:https://javaforall.cn

0 人点赞