DaaS架构及落地 (一)

2022-01-26 14:28:59 浏览数 (3)

1. 序言

DaaS 数据即服务是一种服务模式,即将数据以服务的形式,向客户提供价值,参与到客户的业务中,它也是软件即服务的一种细分领域。同时DaaS 拥有云计算的通用特点,包括以租代买,按需付费、按用付费。

本文介绍 DaaS 的架构及实现选择,对于拥有大量优质数据资源的企业,可以参考构建起数据业务线,进而实现数据的资产化、价值化。需要说明的是本文中的各种图例仅是逻辑示意,均做了简化。

2. 基础架构

系统由四部分组成,包括:

  • 客户基于 API 自研应用从而实现访问数据。
  • API 为数据接口,封装和抽象了数据的定义和许可的数据访问模式。
  • 数据服务是 API 功能的具体实现。
  • 数据库则存储了原始的数据,当然还有非结构化的数据,如一些图片、视频、专有文件等。

这种架构适合两种情况,一是可信的环境内,二是前期的商业验证阶段,优势是结构简单,实施成本低。

3. 官方应用

很多情况下,客户没有应用开发能力,需要接口上叠加一个轻量级的图形化工具,比如网页、小程序。

4. 应用认证

增加 App认证鉴权之后,能缓解对于API 接口安全的焦虑。借助线下、线上的授权,许可特定的应用来访问特定的接口。

5. 模型

基于对于应用场景的理解,将原始数据进行一定的加工,生成模型数据(间接数据),对外提供模型数据。这将简化客户 app 的开发,同时也在一定程度上保护了原始数据。

6. 脱敏

一些数据不能直接对外,需要一些脱敏处理,可以采用动态脱敏或者静态脱敏。动态脱敏是访问时现进行计算,静态脱敏则是提前完成。

7. 库内计算

传统数据库提供了一些计算能力,比如常见的统计函数、存储过程等。现在的新型数据库的算力越来越强,与其将数据传来传去,受限于带宽,还不如把计算下放到数据库中。同时,这也减少了出库的数据,降低了数据安全风险。

8. 计费

计费有很多种方式,这里提两种,一是在 api 层同步或异步进行计费业务,另一种则是以离线的统计日志数据,生成费用。前者计费及时些,但对于工程能力要求高,同时也会造成接口访问效率的降低;后者系统更健壮,但存在滞后问题,这也可以通过商业措施来解决。

9. 开发

当考虑到开发场景,会增加其他的需求,比如测试环境、生产环境,比如 SDK、开发文档。但最考验技术的还是接口的版本问题。

思考

  • 如何做访问加速?
  • 如何做高可用?
  • 如何做弹性?
  • 隐私计算、联邦学习、多方安全计算、可信计算、机密计算是什么?
  • 引入这些之后,DaaS架构会如何演进呢?

作者:黄军雷

数据驱动价值 热爱成就非凡

0 人点赞