Pandas中想剔除字符串中的【第】和【批】这两个字如何做?

2024-02-21 16:40:19 浏览数 (3)

风回云断雨初晴,返照湖边暖复明。

大家好,我是皮皮。

一、前言

前几天在Python白银交流群【东哥】问了一个Pandas数据处理的问题。问题如下所示:大佬们,有个奇怪的问题请教下,我想剔除字符串中的【第】和【批】这两个字,我写成df["合同名称"] = df["合同名称"].str.replace("第", "").replace("批", ""),结果只是替换了【第】,但是【批】还在,如果我分开写成两行,分别剔除就可以。有没有方法,能一次性剔除这两个字?

二、实现过程

这里【瑜亮老师】给了一个指导,如下所示:如果是Python的话,可以使用下面的代码,如下所示:df['合同名称'] = df['合同名称'].str.replace(r'(第|批)', '', regex=True)

后来粉丝自己也找到了原因,刚刚漏了第二个.str,df["合同名称_new2"] = df["合同名称_new1"].str.replace("第", "").str.replace("批", "")

经过指导,这个方法顺利地解决了粉丝的问题。

后来【瑜亮老师】还给了一份代码,也是可以解决问题的,如下所示:df['合同名称'] = df['合同名称'].map(lambda x:re.sub(r'[第批]', '', x))

这也是一种方法,这两种其实都是用正则。

如果你也有类似这种数据分析的小问题,欢迎随时来交流群学习交流哦,有问必答!

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Pandas数据处理的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

0 人点赞