我们学数据分析、学Power BI,学SQL,往往苦于没有好的数据源来练手。网上很多教程、帖子、推文,大多要么不提供数据源,要么拿了很小的几个表来做示范,终究不痛快。其实微软很早就提供了几个经典的数据库案例:AdventureWorks, ContosoRetail,Northwind,WideWorldImporters.
这几个数据库,涵盖了几家零售贸易公司的日常业务,包括销售采购财务等数据,非常全面。表结构清晰、命名规范、表间关系完整,帮助大家学习数据库、学习SQL的利器。尤其对初学Power BI的财务业务人员来说,更能深入地理解Power BI建模的概念。因为Power BI的模型就是一个关系型数据库模型。
本文不打算教大家如何下载、如何建立、如何运行数据库。这个过程比较繁琐,坑多,容易出错。为了让大家更快上手,我斥巨资搭建了一台服务器,在上面部署了这几个数据库,开放给大家。只要能上网,就可以连接使用。带有DW字样的是数据仓库,比较适合我们做分析。其他是OLTP型,不太推荐直接用于数据分析。
如何连接数据库
本文主要以Power BI为例,Excel连接方法类似。
Step1
获取数据——SQL Sever 数据库
Step2
填入IP地址和端口号,用英文的冒号分隔,按确定
Step3
左侧选择数据库,输入用户名和密码,点连接
Step4
出现下图所示提示框,点确定
Step5
左侧将显示所有的数据库,点数据库左边三角形展开数据库里的表,勾选加载即可(可多选表)。
如何进一步学习数据库
上一节只是介绍了Power BI连接数据库的方法,但此时,数据库知识作为数据源加载进入了Power BI,表间关系并不会伴随着加载。那怎么样更详细地查看数据库结构,包括表和视图的设计、关联、触发器等呢?
这时候你需要一款数据库管理工具,比如微软的SSMS,或第三方的Navicat。前者只能用来查看SQL Server 数据库,后者虽然兼容市面上常见的数据库,但需要收费。这里推荐一款免费,支持多种场景数据库的工具——DBeaver社区版。使用方法如下:
Step1
安装完打开后,点左上角插头,在弹框中选择数据库类型(我提供的是SQL Server数据库),点击下一步。
Step2
填写参数,并点左下角【测试连接】。
Step3
弹窗显示需要安装的驱动(不同数据库类型需要不同的驱动),点击下载。
Step4
驱动下载完会自动安装,接下来就可以看到所有的数据库(忽略后三个,没有用)。
Step5
一层一层展开,我们看到,数据库有4个层级:数据库、架构、表、字段。
Step6
点开任意一个表,我们可以看到有三种视图,这里有我们学习了解表结构的最直接的信息。
- 属性,字段属性、主键外键等
- 数据,类似一张Excel表
- ER,这个表和其他表的关系,类似Power BI 的关系视图