小勤:大海,我这个从ERP导出来的数据用Power Query汇总,怎么是一堆乱码啊?
大海:你这ERP怎么是html文件?
小勤:是网页形式的一个表。你看,用网页打开是这样子的,没有问题哦,但是用PQ的Web.Page函数一解析就乱码了!
大海:嗯。你在网页里通过右键菜单看一下编码?
小勤:啊,是这样的:
大海:看到了吗?这是中文的GBK编码,所以Power Query里直接读取的时候会出现乱码。
小勤:那怎么办?
大海:将编码转换一下就好了。
小勤:但是,Web.Page函数好像不支持编码转换啊。
大海:没有关系,我们可以用其他函数进行编码转换。比如你现在已经通过按文件夹的方式导入了数据:
添加自定义列:
小勤:先用Text.FromBinary函数将原文件的二进制内容进行转码成文本?
大海:对的,通过在转成文本的过程中进行编码的转换,然后再用Web.Page函数就可以正确读取了。你看:
小勤:原来这样。