花了几天时间粗略地看完了xgboost原论文和作者的slide讲解,仅仅是入门入门入门笔记。给我的感觉就是xgboost算法比较复杂,针对传统GBDT算法做了很多细节改进,包括损失函数、正则化、切分点查找算法优化、稀疏感知算法、...
其实第一反应是利用正则表达式来操作,但是让用正则表达式以外的操作方式,查了不少方法,最终发现了VIM的宏,觉得挺有意思的,特地记录一下
现在回到那个小练习,由于我们主要用正则来进行替换,因此我们先将第一行内容进行复制粘贴
grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来(匹配到的标红)。
一、校验数字的表达式数字:^[0-9]*$n位的数字:^d{n}$至少n位的数字:^d{n,}$m-n位的数字:^d{m,n}$零和非零开头的数字:^(0|[1-9][0-9]*)$
直接编辑文件 选项-i ,会匹配file文件中每一行的所有book替换为books:
重要声明,本文转载自 : https://github.com/ziishaned/learn-regex
前几天,我们用excel函数=LOOKUP(1,0/FIND(E$1:E$2,A1),E$1:E$2),把文本中的关键字清洗了出来。
df = pd.read_excel('2020.5.20.xlsx', header=0)
这题十分简短精悍,应该是需要找到一个在[a-z0-9_]之外的字符放置在函数前而不影响函数的调用,简单传入: