想要玩转Power BI,为什么一定要学会数据库?

2020-05-09 16:15:15 浏览数 (1)

最近写过多篇文章强调,使用Power BI建立模型时,一定要从SQL导入数据,而不要直接使用excel文件,今天再来啰嗦两句。

这里对比数据库和excel,我们简单列一下问题与优势:

1.excel 不方便多人共享使用数据

excel好比一个移动硬盘,你打开使用excel,你的同事就无法再使用了。

数据库好比网盘,你和同事可以愉快的一起使用网盘或者数据库里的数据。

2.excel无法存放大量数据

excel可以存放几十万、上百万、数千万的数据,但是大数据时代,从来就不缺少数据,当数据量越来越大的时候,excel就无能为力了。而数据库却可以存放海量的数据。

所以,你看到淘宝几亿人使用,背后存放商品的一定不是excel,而是数据库。

3.excel无法处理相对复杂问题

数据库可以应对突发事故,比如数据丢失、数据被盗。数据库可以处理复杂的业务,比如银行存取款业务。

当前,因为大部分公司尤其是大型公司的数据是放到数据库里的,所以现在的数据分析、机器学习、开发工程师等职位在招聘要求中都会明确要求:精通数据库,会使用MySQL。

4.在使用Power BI制作项目报告时,如果你的表有多个……实际情况并不是如果,而是一定:

如果你做了一个一年以上的项目,这样的模型可能是常态。

以上模型是4层结构,严格按照层级划分,已经是最清晰的摆放方式了。

这种情况下,如果你发布到云端,你会面临如此巨大的工作量:

所以我之前写了这篇文章来特地阐述这个问题。

整理你的报告从使用SQL开始

需要指出的是,如果你的模型已经使用excel搭建得比较成熟了,就尽量不要转移数据源到数据库中了,因为一旦修改了数据源,那么模型中建立的关系同时会消失。相信我,你一定会漏掉一个或者几个原模型的关系。不要问我怎么知道的。

如果,实在想使用excel文件,那么也建议使用onedrive中的文件或文件夹,我用了三篇长文来说明为什么要使用onedrive,以及中间会遇到的问题的详细解答:

Power BI刷新避免使用网关,蚊子肉也是腿,电费也是钱

PowerBI从Onedrive文件夹中获取多个文件,依然不使用网关

针对“PowerBI从Onedrive获取文件”两篇文章做个补充

这些应当是在最初接触Power BI或者最开始搭建Power BI报告时应当参考的,否则,等模型比较成熟了,才意识到以上的问题,恐怕就会像我转移数据源时一样,特别抓狂。

5.数据回写

不知道你有没有将powerbi或者powerquery中的数据进行导出的需要?

诚然,可视化对象是可以导出csv文件的,并且导出数据的限制也可以通过DAX studio来绕开。不过powerquery中的数据清洗结果你能导出吗?正常情况下自然是不能的。

不过,想要导出我们还是有办法的:

【重磅来袭】在Power BI 中使用Python(4)——PQ数据导出&写回SQL

Power BI数据回写SQL Server(1)没有中间商赚差价

Power BI数据回写SQL Server(2)——存储过程一步到位

PQ获取TABLE的单一值作为条件查询MySQL返回数据

PowerBI借”第三方“将度量值回写SQL与天猫总裁的两个88年女人

读完这几篇文章,你会发现,如果不想再多学习一门Python语言,那么使用PQ导出excel就不太可能了,而直接回写SQL是一个完美的选择。

结论

综上,使用SQL来保存数据要远远比excel更加稳妥与方便,而且你所要学习的知识其实也并没有多少,如果不需要深入学习SQL用来直接做数据分析,很快就能入门。

而且使用Navicat可视化工具可以让你摆脱纯粹命令行的困扰,用手动操作的方式实现各种入门的操作:

次条的几篇是我整理的MySQL的安装过程,已经是最简单最避坑的操作了,有需要的朋友可以先从安装开始来学习MySQL。最近会整理几篇MySQL的入门文档,大家可以留意。

0 人点赞