什么是数据流(Dataflow)
数据流是包含创建数据集的说明的文件,可用于爱因斯坦分析数据可视化。数据流的真正力量是在应用转换时实现的。转换可以定义为将数据从一种格式或结构转换为另一种格式的过程。
什么是数据集(Dataset )
Dataset 是一组数据,将其视为一个表或一组值,其中每个列代表一个特定变量,每行对应于有关数据集的给定记录。
Image:
1.开始创建数据流
Data Manager→Dataflows & Recipes→Create Dataflow
2.DataSetBuilder
这是在任何数据流的顶部窗格上遇到的第一个。把它想象成一个向导。首先,它的目的是轻松地构建对象和关系。它允许获取你打算用于数据集的对象、字段和关系。
下边以Opportunity,Account,User三个表为例,分别添加进去。
Opportunity:
- Amount,Close Date,Created Date,Lead Source,Name,Opportunity Type,Stage
同样方法,在关联Object(Account,User)中添加下边项目
Account:
Account Name,Account Type,Billing City,Billing Country,Billing State/Province,Industry
User:
Full Name,Title
成功后效果:
3.添加【filter】
4.Run Dataflow
5.结果展示
6.除了立刻执行,还可以设置时间,定期执行
1)Schedule the Data Sync and the Dataflow
2)schedule your US Sales Dataflow
7.Dataflow做成时,关于数据转换,常用功能介绍
1)sdfcDigest and Digest
这两个都是获取数据转换用的,其中sdfcDigest 时用于获取本地数据源,Digest是用于获取外部数据源。
2)Edgemart
可以从现有数据集中获取数据
3)Append
可以将一个数据集添加到另一个数据集中,它将多个数据集中的行组合到单个数据集中。
4)Augment
可以用于将两个表关联上,结合到一个数据集中。
5)computeExpression and computeRelative
计算表达式,用于项目转换
6)Filter
可以在摘要"过滤条件"内进行筛选
7)sfdcRegister
最后使用sfdcRegister,将结果保存到 DataSet 中。