作为数据分析的爱好者,之前我是Tableau Desktop的深度用户,由于Tableau Desktop收费,免费的Public版本又在数据连接上有限制,所以常常限制了我的使用。从去年开始,我就切换到了国产的数据分析产品Yonghong Desktop。原因有二:一是Yonghong Desktop免费,二是Yonghong Desktop的表现丝毫不逊色于Tableau。
在开始之前,大家可以先扫码下载软件试用一下,或许能对本文的内容了解得更深刻。
Yonghong Desktop官网,下载软件请用PC端访问
接下来我会从数据分析全链路对二者进行了较为全面的比对,结果让我略感惊讶。闲话少说,先列举一下比对的方面:
01数据连接
国产化支持Yonghong胜出,国外支持和丰富程度上Tableau胜出
Tableau Desktop界面如下:
Yonghong Desktop界面如下:
都有丰富的数据源支持,Yonghong Desktop特别支撑国产数据库,如腾讯云数据库(CTSDB等),华为云数据库(高斯等),还支持达梦、星环、GBase、Kyligence等。在文件类型上,都支持常见的文件格式,Tableau支持的更多一些。如果原生连接不支持,也就是未出现在连接列表里的,Tableau通过JDBC、ODBC、Web数据连接器或连接器插件进行连接。Yonghong Desktop则提供General的连接方式连接JDBC数据库,也可以通过定制数据集获取数据,或通过RESTful API的形式获取数据。
值得一提,永洪自己写了一套SQL解析器,可以通过Data Mart的连接,用标准的SQL来查询数据集市里的数据。
02数据治理
Yonghong Desktop胜出
Tableau Desktop支持物理表的联接或逻辑表的关联,并且提供了一部分数据治理和清理的功能,不过其更多的数据准备功能集成到了Tableau Prep中,导致Desktop里的数据准备功能相对比较简易,只能满足少量情况下的使用。
Yonghong Desktop的数据准备功能可以直接查询物理表或视图,也可以写SQL语句查询表、视图或存储过程,同时面向业务人员支持自服务数据集,提供完整的可视化数据建模能力,用拖拉拽的方式完成同源/异源数据集联接、联合、聚合、去重等多种操作。同Tableau类似,如果基础数据未包括回答问题所需的所有列(字段),则可以在Yonghong Desktop中使用计算创建新列,Yonghong Desktop支持100多个计算函数,还可以进行直接直观的数据转化,如日期转年、季度等层次、数据分箱、分组、值映射、缺失值填充、拆分列、去空格等,这些通过可视化的界面即可轻松创建。还可以通过血缘分析查看整个数据的使用流向,也具有不错的使用体验。
03可视化分析
都很强大,Tableau略胜一筹
以下是我在Yonghong Desktop上做的一些以前通过Tableau Desktop进行数据分析例子:
01动态计算
以上通过lookup动态计算函数实现同环比计算。另外Yonghong Desktop支持更多的动态计算,包括差值、百分比、差值百分比、汇总百分比、累积总计、移动计算、排名计算、百分位等,基于这些计算可以轻松实现在可视化图表的数据上的二次计算。
02LOD(fixed/include/exclude)计算
以上是通过fixed函数算出第一次和第二次的购买时间,并在此基础上计算间隔时间(季度)的例子,从而可以看出每个季度流失客户和再次购买客户的间隔时间情况。
03目标线
以上通过目标线的分布区间来计算每个省份的第90个百分位。
04参数应用
以上例子通过动态计算来实现帕累托图,并通过传参给目标线,实现修改“销售百分比参数”的值,查看不同参数值情况下的子类别分布情况。
通过对比Tableau Desktop和Yonghong Desktop,我发现,在可视化数据分析上,两者几乎没有差别,Yonghong Desktop甚至支持更多的图表类型,更多的组件交互联动,使用上也更简单,比如在跨源组件联动时,可以通过组件之间进行参数值的传递,来实现点击一个图表视图,联动过滤展示另一个图表视图的数据。Yonghong Desktop在自助分析、敏捷BI领域真正的是对标Tableau,我试用的场景用Yonghong Desktop都能做到。
Tableau的图表效果十分精美,这块Yonghong Desktop应该要再花力气提升一下,不过从近一年多我使用Yonghong Desktop来看,其在视觉看效果这一点上也在不断进化。
Yonghong Desktop官网,下载软件请用PC端访问
04高性能计算
1亿行的数据量,在个人电脑进行数据分析,两者都超快。
Tableau在2018年初,10.5版本开始,引入了高性能引擎技术Hyper。
Yonghong Desktop发布之初使用的是MPP高性能计算引擎,从9版本开始升级了高性能计算引擎并命名为VooltDB。可以看到现在Yonghong Desktop内置的是VooltDB引擎,启动后自动起了VooltDB节点,在Server上,VooltDB是收费的,而Desktop上则可以直接使用。
这里我拿了10列数据(1个日期时间列,4个文本列,5个数值列),1亿行数据进行了简单的比较。
选择Tableau Desktop的数据提取,在切换到工作表的过程中,会弹出选择存储路径的窗口,数据以.hyper的文件形式存储下来。提取过程如下:不能点取消,抽取1亿的数据会花几十分钟时间,这期间只能等,不能操作客户端。
抽取完成后,Tableau Desktop上制作工作表进行分析的过程响应在秒级。
Yonghong Desktop是直接在数据集上点数据抽取,抽取数据过程如下:
抽取任务在后台运行,也可以从调度任务里,去查看详细任务进度:
抽取完成后,制作报告基于5000行样本行数进行制作响应时间几乎为零,查看报告里查询全量数据也是秒级响应。
制作报告和查看报告:
10列1亿行的数据从性能上看两者没有明显的区别,如果需要对比出差别,可能需要更多的样本数据(更多的行列数)进行比较。但就个人电脑来说,能在笔记本上分析处理亿级数据,我觉得Yonghong Desktop和Tableau Desktop都太厉害了。
05数据安全
都能实现行级别数据权限,但Yonghong Desktop控制的更细一些
永洪Desktop提供了行级别通过数据过滤和产品内置参数(?{_USER_},?{_USER_ALIAS_},?{_GROUPS_},?{_ROLES_})的联动来控制数据行权限的管理,也支持列级别的数据权限控制,同时还支持设置在Desktop中设置敏感信息的脱敏规则,以实现对数据中的敏感信息进行保护,还可以继承来自Server的数据列黑白名单限制。整体在数据安全上的功能比较完整和丰富。
Tableau Desktop也可以通过筛选器和语句来实现行级别的权限控制,但是在Desktop端就没有在设置更多的安全保护措施了。
06产品与服务费用
Yonghong Desktop胜出
通过下图来参考Tableau的费用,Creator包含了Tableau Desktop、Tableau Prep Builder和Tableau Server。增强的数据治理和了解数据情况的Data Management还需要单独订阅。
Tableau官网上有少许免费基础入门课程,更多的教学培训课程Tableau eLearning定价销售,分为Creator课程和Explorer课程。Creator课程,按10美元/用户/月,需要按年付费。Explorer课程,按5美元/用户/月,需要按年付费。
Yonghong Desktop永久免费,不收取任何费用,真香!我可以在Desktop上制作报告,然后上传至免费的Yonghong X Viewer (Server版)。X Viewer和收费版的Z-Suite的最大区别在于只能查看报告不能编辑报告,且只有一个用户账号。想想,对很多部门和中小企业而言,搭建这样的系统基本就够了,而且还是全免费的。
永洪有完善的社区(社区地址:https://club.yonghongtech.com/),几乎全部的使用问题和系统问题都可以在社区上自主找到答案,另外永洪定期举办免费的线上培训服务,听了几次,干货颇多,质量很高。
二者的功能都非常强大,且都在不断进步和完善,国产化浪潮席卷而来,个人十分看好Yonghong Desktop。在接下来的一两年中,Yonghong Desktop将很可能迎来数量级的用户增长,墙裂推荐。
Yonghong Desktop 永久免费提供
扫描海报二维码或点击“阅读原文”
轻松获取Yonghong Desktop&X Viewer
(下载软件请用PC端访问)
20w 数据爱好者及中小企业都在使用
点击阅读原文获取软件