if语句
用来检验一个条件,如果条件为真,运行if-块的语句;否则处理else-块。
else从句是可选的。如果有多个条件,中间使用elif。
for语句(循环语句)
for...in...是一个循环语句,即逐一使用队列中的每个项目。
while语句(循环语句)
是一个循环语句。
只要在一个条件为真的情况下,while语句允许重复执行一块语句。
有一个可选的else从句。
break语句(用于终止循环语句)
如果从for/while循环中终止,任何对应的循环else块将不执行。
continue语句
跳过当前循环块中的剩余语句,继续进行下一轮循环。
变量名命名:为清晰表达——驼峰式、下划线式
代码语言:python代码运行次数:0复制LookLikeThis = 1
look_like_this = 1
正则表达式(调用re模块实现)
- re.search(pattern, string, flags=0)
- re.match(pattern, string, flags=0)
函数参数说明:
参数 | 描述 |
---|---|
pattern | 匹配的正则表达式 |
string | 要匹配的字符串。 |
flags | 标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。 |
re.match与re.search的区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。
代码语言:python代码运行次数:0复制import re
line = "Cats are smarter than dogs"
matchObj = re.match(r'dogs', line, re.M | re.I)
if matchObj:
print("match --> matchObj.group() : ", matchObj.group())
else:
print("No match!!")
matchObj = re.search(r'dogs', line, re.M | re.I)
if matchObj:
print("search --> matchObj.group() : ", matchObj.group())
else:
print("No match!!")
No match!!
search --> matchObj.group() : dogs
示例:
检索和替换(re.sub)
Python 的 re 模块提供了re.sub用于替换字符串中的匹配项。
语法:
代码语言:python代码运行次数:0复制re.sub(pattern, repl, string, count=0, flags=0)
代码语言:python代码运行次数:0复制参数:
pattern : 正则中的模式字符串。
repl : 替换的字符串,也可为一个函数。
string : 要被查找替换的原始字符串。
count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。
import re
phone = "2004-959-559 # 这是一个国外电话号码"
# 删除字符串中的 Python注释
num = re.sub(r'#.*$', "", phone)
print("电话号码是: ", num)
# 删除非数字(-)的字符串
num = re.sub(r'D', "", phone)
print("电话号码是: ", num)
电话号码是: 2004-959-559
电话号码是: 2004959559
re.compile函数
compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象,供 match() 和 search() 这两个函数使用。
语法格式为:
代码语言:python代码运行次数:0复制re.compile(pattern[, flags])
参数:
pattern : 一个字符串形式的正则表达式
flags : 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:
re.I 忽略大小写
re.L 表示特殊字符集 w, W, b, B, s, S 依赖于当前环境
re.M 多行模式
re.S 即为 . 并且包括换行符在内的任意字符(. 不包括换行符)
re.U 表示特殊字符集 w, W, b, B, d, D, s, S 依赖于 Unicode 字符属性数据库
re.X 为了增加可读性,忽略空格和 # 后面的注释
通过re模块的compile()函数编译得到的正则表达式对象(下面用regex表示)支持如下方法:
正则表达式对象中的方法和属性
参数说明:
- string: 要匹配或处理的字符串
- pos: 可选参数,表示从string字符串的哪个位置开始,相当于先对字符串做切片处理string[pos:]
- endpos: 可选参数,表示到string字符串的哪个位置结束(不包含该位置)
- maxsplit: regex.split()方法的可选参数,表示最大切割次数;默认值为0,表示能切割多少次就尽可能多的切割多少次
- count: regex.sub()和regex.subn()方法的可选参数,表示最大替换次数;默认为0,表示能替换多少次就尽可能多的替换多少次
- repl: sub和subn函数中的repl表示replacement,用于指定将匹配到的子串替换成什么内容,需要说明的是该参数的值可以是一个字符串,也可以是一个函数