让我们来依次了解这些内容。
首先我们要打开一些预览特性,然后就可以随BI佐罗一起探索新功能了。
页面自动刷新
当使用 DirectQuery 方式连接到数据源时,就可以在页面设置自动刷新的时间间隔,如下:
不难看出可以最细设置到 1 秒的级别。先来看看实际的效果吧:
可以看出整页报告在按照 1 秒级刷新。这非常重要,这打开了一个新的世界:实时报告。为了讲解实时报告,我们将在随后专门来介绍,这里面有新的细节。值得说明说:
- 这是实时报告,不是实时仪表板; 报告是 PowerBI 中更一般化的构件,也就意味着 PowerBI 开放了一项新的能力给到用户。
- 该模式不需要完全基于 Direct Query,可以是混合模式,也就意味着 PowerBI 报告的一部分可以是定期刷新; 而另一部分则可以完全实时; 这便实现了 定期报告 与 实时报告 的统一。
- 这是一种经典的查询下压,将用户的需求,从报告层下压到数据源层,而这种查询的下压是通过 DAX 引擎将 DAX 自动翻译为 SQL 的,进而从数据源拉取数据。
- 这与 PowerBI 实时流分析不同,PowerBI 实时流数据集位于被动地位,必须由数据端将数据推送至数据集,而且必须基于 PowerBI 在线版,在可视化时,由于要使用实时流数据集表现实时可视化,必须基于 PowerBI 的仪表板,这大大削弱了 PowerBI 的价值; 与此不同,实时报告则更加完美地平衡了这些,可以主动从数据源拉数据,而且对于所有可视化对象构成的报告都是实时的。
更多关于由于页面自动刷新特性的引入,如何设计实时报告这必须基于 DirectQuery ,而 DirectQuery 的使用与 原生 DAX 有一定区别和限制,以前我们并不强调 DQ 的作用,由于有了实时报告,我们必须专门研究 DQ 和 DAX 的最佳实践以获得最佳平衡。关于这方面,我们将在后续的文章给出相关参考和最佳实践。
读者可以自己尝试,如何制作一个实时报告,也保证柱状图停留在固定的时间窗口,如:1分钟。
脑洞打开:如果有了实时报告,那么用户的行为,电商的销售数据,IT的设备运行等和时间密切相关的分析就可以得到前所未有的分析及可视化支持。
注意:如果你打开了预览功能,你也看不到页面设置刷新时间间隔是因为你必须在这页使用至少一个基于 DQ 模式的视觉对象。
关于实时报告,要最后补充的是,这是一项完全免费的特性,请你自行脑补它将带来怎样的生产力,非常凶残。
新的问答可视化对象
从视觉对象窗格可以直接使用新的问答可视化对象,如下:
在输入栏可以提出问题,但系统提示目前仍然只是支持英语。
我们输入一个:
关于蓝色划线的关键词:模型中有的维度或度量值。
关于正常无下划线的关键词:符合英语自然语言的语法使用。
关于红色划线的关键词:既不符合英语自然语言的语法使用习惯也不是数据模型中的维度的。
因此,PowerBI 必须给设计者一个机制,可以来修复这些不合理的习惯并训练 QA 功能以使得这个功能更加贴近用户的自然习惯。一个好消息是,虽然这里写了只支持英语语言,但在一定程度上对于中文的使用还是有意义的,这些我们会在随后的文章中单独说明。
那么在 PowerBI 中如何修复并持续训练就可以使用本次更新的机制:
点击右上角的齿轮图标,就可以去配置这些训练的内容。
可以通过三个主要步骤:
- 审阅问题
- 教授“问答”
- 管理术语
来人工帮助 AI 机制更加合理。这里再次证明了即使是微软这样级别的巨头开发的 AI 功能都必须在辅以人工的情况下才能更加自然,可见单纯追逐 AI 是成本巨大的。微软提出的面向 BI 的普适型的 AI 的确更加有道理。我们可以看看用户都经常问什么问题:
审阅问题可以帮助设计师更好的了解用户关注的内容。但用户提出的问题可能是不合理的,就需要修复,可以使用教授“问答”功能,如下:
这里的最大特点就是你可以用了一个你认为正确但实际不正确的术语,也就是一个名词,所以我们需要定义它,与我们数据模型的某个维度属性或度量值一致,如下:
这样,就完成了一个完整的迭代优化过程。
为了让用户有更好的问答体验,我们还可以设置数据模型中维度属性的同义词,如下:
也就是说,当你输入任何同义词列表的关键词时都意味着使用了该数据模型的维度或度量值。最终我们就可以得到这样自然的效果:
如果您足够细心的话,你应该可以提出这样一个问题:它为什么知道地点要返回一个省份而不是城市呢?实际上,地点表示了整个地理位置表(Model_Geo),而为什么输入一个表会自动锁定到某个列而不是另外的列呢,这就需要一种默认设置,如下:
可以看到这就是一种默认设置。
关于 QA,通过本次更新已经被此前的 QA 有了大幅度的改进,关于如何使用 QA 的最佳实践我们会单独开文章详细说明。
SSAS支持问答
来看看吧:
从左上角只有一个可视化图标,可以看出这是一个基于 SSAS 的报告,这是可以基于 SSAS 使用 PBI 问答功能的,这属于 SSAS 范畴的企业级功能的增强了。
可视化方面的增强
默认包括 PowerApps 视觉对象
关于 PowerBI 结合 PowerApp 使用是一个独立的主题,我们也将在未来专门介绍。
新的xViz视觉效果
这个大家就在官网下载体验吧:
层级变化对比表
线型仪表板
标签云
PowerBI 中的视觉对象日趋丰富,我们会在未来专门来研究这些可视化与默认可视化的用法和讨论,当然掌握默认可视化的用法由于是由微软原生给出,更加稳定可靠,一定是优先考虑的。另外,DAX 驱动可视化也补充了默认可视化的能力。
数据连接
在数据连接方面,本次给出了可以管理 Azure 成本的连接以及对 Microsoft 工作区的连接,这些更大地集成了 PowerBI 与微软自家应用之间的结合。
数据准备
查询诊断
本次更新推出了一个重要的功能:查询诊断。这是用来诊断 PowerQuery 的查询过程的。如下:
这一特性的主要目的是面向IT的,用来诊断 PowerQuery 的查询耗时问题。使用方法是:
- 点击【开始诊断】
- 刷新 PowerQuery 相关查询
- 点击【停止诊断】
系统会生成两个表:诊断的汇总信息和诊断的详细信息。如下:
对于高级用户来说,可以通过这些信息来进一步打开 Power Query 运行的黑箱来检查可能的查询时间瓶颈,而这也只是对 Power Query 查询诊断第一次给出的功能,未来还会有所增强,这让我们拭目以待,届时我们再做详细介绍。
数据质量分析增强
在 Power Query 中可以大致看到数据的质量情况,如下:
这比此前增加了更多的分析信息,以便对于数据有一个大概的质量判断。
新的文件格式:.pbids
以下内容来自官方博客翻译:
本月我们将发布一种新的文件格式:PBIDS,以简化组织中报表创建者的“获取数据”体验。建议管理员为常用连接创建这些文件,以帮助新的报告作者获得入门经验。
当作者打开.PBIDS文件时,Power BI Desktop将启动并提示进行身份验证以连接到文件中指定的数据源。然后将弹出导航对话框,用户将需要选择表以加载到模型中。如果文件中未指定数据库,他们可能还需要选择数据库。用户可以从那里开始构建可视化效果或重新访问“最近的来源”,以将一组新表加载到模型中。
为使管理员创建此文件,他们将需要在文件中指定单个连接的必需输入,并且他们可以指定连接方式。“模式”可以是“ DirectQuery”或“导入”。如果“模式”丢失/为空,则将提示在Desktop中打开文件的用户选择DirectQuery或Import。
这是用于SQL Server连接的PBIDS文件的示例:
代码语言:javascript复制{
“version”: “0.1”,
“connections”: [
{
“details”: {
“protocol”: “tds”,
“address”: {
“server”: “<<server-name>>”,
“database”: “<<db-name (Optional)>>”
}
},
“options”: {},
“mode”: “DirectQuery”
}
]
}
建模的性能改进
本月微软更新了分析服务引擎对建模支持的性能改进包括:创建度量值,计算列和关系将更快。尤其是在满足如下的条件:
- 包括很多计算。
- 使用了 USERELATIONSHIP 或 CROSSFILTER 函数
- 使用了 TODAY,NOW,RANDOM 等易失函数(啥叫易失,就是很容易返回不同的值,几乎每次都是不同的值,因此无法也没有必要缓存)
通过测试反馈,有的甚至表示可以增加 20 倍的性能。之前有很多伙伴诟病一旦计算列和度量值多了就打开很慢或者添加度量值很慢,原因据罗叔猜测是因为增加定义的时候会重新保存数据模型的定义框架,但这从软件的角度其实可以优化,本次便是,大家可以尝试下是否有明显地变化。
总结
本月更新有几个大事,我们一起来总结下:
- 基于 Direct Query 已经页面刷新功能可以构建实时报告,我们未来将进一步详解。
- 更加完善的基于 AI 的 QA 功能,我们未来将进一步详解。
- 默认集成了 Power Apps 进入 PowerBI 也就明确了 Power Apps 对 PowerBI 的默认原生地位,我们未来会进一步详解。
- 最后 Power Query 给出了查询诊断的功能。
本月的更新很多,尤其是 实时报告 打开了一个新的世界,再欣赏一下吧,打开脑洞,可以实现的东西很多,一切才刚刚开始。