盘点一个Python自动化办公的问题

2024-06-24 20:35:39 浏览数 (1)

大家好,我是Python进阶者。

一、前言

前几天在Python铂金交流群【逆光】问了一个Python自动化办公的问题,问题如下:问题 我现在有两个表a、b ,for 循环a、b ,如果a的条件满足b,则把b的值赋给a ,目前a有7万条数据,b有300条。我写的代码20分钟都没跑完。这是代码,请问改怎么解决?

二、实现过程

这里【瑜亮老师】给了个思路如下:

【瑜亮老师】:数据是在df中?

【逆光 】嗯嗯,是的

【瑜亮老师】:那你不能这么写,熊猫一见for循环,思路基本就玩完。

【逆光 】:请问那咋整呢?

【瑜亮老师】:你的需求是根据jd mergeTotal['付款公司编码']列中元素 在 JD_zhekou中查找对应的公司名。结果保存在jd_mergeTotal['公司']列中,Total['付款公司编码']列是和zhekou['公司组织编码']对应的,都是公司的组织编码。

【逆光 】:对的,本来可以用merge 但是后期可能会添加total的单量满足折扣的条件才能匹配,所以我用了for循环。

【瑜亮老师】:先merge,后期如果需要添加条件,只需要加一行对结果的筛选即可。

【逆光 】:对结果的筛选?

【瑜亮老师】:先筛选,后merge。这样可以减少运算时间。而先merge后筛选,可以复用merge后的df,做更多筛选动作。看你的需求了。

【逆光 】:因为我是初学哈,我不是很懂,如果先merge 那不是一对多了吗?

【瑜亮老师】:什么一对多?

【逆光 】:第二个表,可能是这样啊,如果加入单量条件的话,主键编号就不是唯一的了。如果是多个关键字连接的话,单量是个范围,怎么弄进行判断呢?

【瑜亮老师】:远程吧,或者你发一个脱敏的两个表的数据。最好是你发一个脱敏数据。

【不上班能干啥!】:如果先merge,就匹配完再筛选。先筛选再匹配跟上面的结果是一样的,只是先merge过程产生的数据会多。别说加一个单量条件了,你加很多的条件也是这样的,总之先merge。

【瑜亮老师】:是的,先筛选省时,先merge可多次筛选。

【逆光 】:先merge ,后再筛选,咋个筛选呢?

【瑜亮老师】:主要是根据需求。如果只是筛选一次,那就先筛选。如果后期还是会有各种筛选,那就先merge。你发一个脱敏数据吧。无非是两行代码先后顺序的问题,这个不用纠结。

【逆光 】:我不知道怎么弄筛选?

【不上班能干啥!】:new_df = df1.merge(df2) new_df = new_df[new_df['判断列'] = 条件],不就这样吗,等于,大于,小于,包含,没别的了。

【逆光 】:我好像懂你的意思了,我去试一试。

【小小明】:你发个测试数据,我可以帮你写。。。你可以想个可能出现的条件,可以不用merge。给出的具体代码如下:

代码语言:javascript复制
companies = []
nums = []
for row in jd_MergeTotal.itertuples(False):
    tmp = JD_zhekou.query(f"公司组织编码=='{row.公司编码}'")
    companies.append(tmp.公司.iat[0])
    discount_dest = None
    for _, _, num, discount in tmp.itertuples(False):
        min_v, max_v = map(int, num.split("-", maxsplit=1))
        if min_v <= row.单量 <= max_v:
            discount_dest = discount
            break
    nums.append(discount_dest)
jd_MergeTotal["公司"] = companies
jd_MergeTotal["折扣"] = nums
jd_MergeTotal

顺利地解决了粉丝的问题。

如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!

三、总结

大家好,我是Python进阶者。这篇文章主要盘点了一个Python自动化办公的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【斌】提出的问题,感谢【瑜亮老师】、【不上班能干啥!】、【小小明】给出的思路,感谢【莫生气】等人参与学习交流。

0 人点赞