昨天,群里传出一份数据,要求对其中的日期整理一下:
该数据实际出自ExcelHome案例
数据一上传,群友惊呼“涨姿势”:
不过,也有高手一语道破:其实Excel里用分列改格式就能解决掉大部分问题。
这个分列的操作留给大家尝试,这里讲讲PQ里的解法。
仔细观察这些日期,大致可以分为两类:
- 一类是PQ里能直接识别的,也就是说能用函数直接转换的;
- 还有一类是不能直接识别的,但基本都是因为其中在年月日间用了各种乱七八糟的符号的,对于这些,我们可以将其中的非数字替换掉,变成可以用函数转换的形式。
直接上公式:
代码语言:javascript复制try Date.From([出生日期]) //可用日期函数识别
otherwise
try Date.From(DateTime.From([出生日期])) //可用日期时间函数识别
otherwise
Date.From(
Text.Combine(
List.Transform(
Text.ToList([出生日期]),
(x)=>if List.MatchesAny( //非数字字符替换为- {"0".."9"},
each _=x
)
then x else "-"
)
)
)
主要实现过程:
- 第一个try,用Date.From函数转换出可以用日期函数识别的内容;
- 第二个try,用DateTime.From函数转换出可以用日期时间函数识别的内容,然后再用Date.From函数提取其中的日期;
- 对于try不出来的,将内容转为列表(Text.ToList),然后判断列表中每一个字符(List.Transform)是否为数字(List.MatchesAny),如果是则保留,否则替换为"-",最后再合并(Text.Combine)然后用日期函数(Date.From)转换。
当然,这个公式也只能适用于这个案例里所遇到的情况,如果情况进一步复杂,比如有的朋友继续举例:
那就要再进一步改进公式了,不过,诚如前面一位朋友所说,如果一份数据的日期能乱成这样,哪怕做这个表的是老板娘,也炒她鱿鱼算了……