在许多场景中,我们需要验证用户输入的数据是否有效,或者是查找并修改文本,或者是提取指定数据,为此,相对于Qstring的一些函数,QT提供了一个更加强大的类——QRegExp,使用函数配合正则表达式来操作字符串,QRegExp可以进行下面的操作,并附带检验小程序,可在文末下载。
一.正则表达式相关函数用法
1.提取数据
matchedLength() 匹配的长度
capturedTexts() 捕捉到的字符串列表, 对应的还有captureCount() ,获取表达式中含有的捕捉组的数目
cap(int n) 第n个组的内容(0代表匹配自身)
- cap()参数缺省值为0。
- cap(0):表示匹配的整个文本的值。
- cap(1):表示第1个圆括弧中的值。
- cap(2):表示第2个圆括弧中的值。
代码语言:javascript复制pos(int n) 第n个组的位置(默认值为0)
QRegExp::indexIn() 搜索字符串以找到匹配的字串,返回索引值,失败返回-1
QRegExp::lastIndexIn() 同上,只是从后向前搜索
QString str = "(.*)=(.*)";
QRegExp rx_1(str);
QString str_1 = ("a=100");
int pos = rx_1.indexIn(str_1);
if(pos>=0)
{
qDebug()<<rx_1.matchedLength(); //5
qDebug()<<rx_1.capturedTexts(); //("a=100", "a", "100")
qDebug()<<rx_1.cap(0);//"a=100"
qDebug()<<rx_1.cap(1);//"a"
qDebug()<<rx_1.cap(2);//"100"
qDebug()<<rx_1.pos(0);//0
qDebug()<<rx_1.pos(1);//0
qDebug()<<rx_1.pos(2);//2
}
(?:pattern)是非捕获型括号 匹配pattern,但不捕获匹配结果
(pattern)是捕获型括号。 匹配pattern,匹配pattern并捕获结果,自动获取组号
(?<name> pattern ) 匹配pattern, 匹配pattern并捕获结果,设置name为组名
例如,将(.*)=(.*)改为(?:.*)=(.*),qDebug()<<rx_1.cap(1);该值将为100,而 qDebug()<<rx_1.cap(2);将为空。
2.修改文本
将匹配到的字符串替换成其他字符串,例如将文本中的a=100修改为b=100
代码语言:javascript复制QString str = "a=100";
s.replace(QRegExp("(.*)="),"b=");
将匹配到的字符串内容进行自定义或替换,例如将文本中的a=100修改为100=a
代码语言:javascript复制Qstring str = "a=100";
s.replace(QRegExp("(.*)=(.*)"),"\2=\1");// \1就是相当于cap(1),表示第1个圆括弧中的值。
3.验证文本有效性
这里用到QRegExp::exactMatch来判断输入的字符是否符合正则表达式。
代码语言:javascript复制QRegExp::exactMatch() 判断字符串是否完全(从头到尾)匹配,返回真或假
QRegExp rx("\d"); //正则表达式
bool match = rx.exactMatch("8");//验证文本
if(match == true)
{
//表达式正确
return;
}
//表达式错误
对此,QRegExp都有相对应的函数方法,还有一些函数上面没有写出来,例如:
isValid();//判断正则表达式是否合法,合法返回true,否则返回false。 pattern();//获得正则本身
其他完整函数,大家可在文末点击官方文档查阅,当然,所有的函数方法都离不开一个核心就是正则表达式,我们来看下。
二.正则表达式
正则表达式是由表达式 量词 断言组成。
首先是表达式:
例子 | 含义 |
---|---|
c | 除非具有特殊的正则表达式含义(., ^, $, [, ], * , , ? ),否则字符表示自身。例如c匹配字符c |
c | 除以下指定的字符外,反斜杠后面的字符与字符本身匹配。例如,要匹配字符串开头的文字插入符,请写 ^ |
a | 匹配ASCII铃声(BEL,0x07) |
f | 匹配ASCII换页(FF,0x0C) |
n | 匹配ASCII换行符(LF,0x0A,Unix换行符) |
r | 匹配ASCII回车(CR,0x0D) |
t | 与ASCII水平制表符(HT,0x09)匹配 |
v | 匹配ASCII垂直制表符(VT,0x0B)。 |
.(dot) | 匹配任何字符(包括换行符) |
d | 匹配一个数字 |
D | 匹配一个非数字。 |
s | 匹配一个空白字符 |
S | 匹配非空格字符。 |
w | 任意单字字符(字母,数字或者下划线) |
W | 任意非单字字符 |
n | 第n个反向引用,例如 1, 2等。 |
注意: C 编译器将反斜杠转换为字符串。要将包含在正则表达式中,请输入两次,即\。要匹配反斜杠字符本身,请输入四次,即\\。
最简单的一个正则表达式就是字符,例如:
- a 匹配字符a
- b 匹配字符b
- 9 匹配数字9
表达式后面可以加量词,默认情况下,表达式会自动由{1,1}进行量化,即它应该只出现一次。在下面的列表中,E代表表达。表达式是一个字符,或者是一组字符的缩写,或者在方括号中是一组字符,或者在括号中是表达式。
例子 | 解释 |
---|---|
E? | ?代表0个或1个 |
E* | *代表0个或1个或多个 |
E | 代表1个或多个 |
E{3} | 匹配3次 |
E{3,} | 匹配大于等于3次 |
E{,6} | 匹配至多m次,等价于a{0,m} |
E{3,6} | 匹配至少3次,至多6次(包括3和6) |
例如:
- E?匹配0次或者1次E
- E 匹配1次或者多次E
- E{3,6} 匹配至少3次,至多6次E
可以在表达式和量词的基础,加入断言,进行一些限制,例如我们想要匹配0-9,我们可以将正则表达式写为/d,如果我们想要匹配0-99,我们可以写成[0-9]{1,2},这时,字符串“89”符合,字符串“我们今年21岁了”也符合,因为里面有21,单独使用[0-9]{1,2},它会匹配包括出现在字符串中间的整数,如果想匹配的整数是整个字符串,那么就需要使用断言“^”和“$”了。 断言在正则表达式中出现的位置对文本进行一些声明,但不匹配任何字符。在以下列表中,E代表任何表达式。
例子 | 解释 |
---|---|
^ | 尖号表示字符串的开头。如果您想匹配文字,则必须通过书写将其转义。例如,^#include将仅匹配以字符’#include’开头的字符串。(当插入号是字符集的第一个字符时,它具有特殊含义,请参见字符集。) |
$ | 美元表示字符串的结尾。例如, d s * 将 匹 配 以 数 字 结 尾 ( 可 选 ) 后 跟 空 格 的 字 符 串 。 如 果 您 想 匹 配 文 字 将匹配以数字结尾(可选)后跟空格的字符串。如果您想匹配文字将匹配以数字结尾(可选)后跟空格的字符串。如果您想匹配文字,则必须通过书写将其转义$。 |
b | 单词边界。例如,正则表达式 bOK b表示在单词边界(例如字符串或空白的开头)之后立即匹配字母“ O”,然后紧接在另一个单词边界(例如字符串或空白的结尾)之前匹配字母“ K”。但是请注意,该断言实际上并不与任何空格匹配,因此如果我们编写( bOK b)并且具有匹配项,即使该字符串为“ It’s OK now”,它也将仅包含“ OK ”。 |
B | 非单词边界。只要 b为假,该断言就为真。例如,如果我们在“ Left on”中搜索 Bon B,则匹配将失败(字符串的空格和结尾不是非单词边界),但将在“ t on ne”中匹配。 |
(?= E) | 如果表达式此时在regexp中匹配,则此断言为true。 |
(?!E) | 如果此表达式在regexp中不匹配,则此断言为true。 |
除此之外,还有其他一些其他字符可以和表达式组合,方括号表示匹配方括号中包含的任何字符。上述字符集缩写可以出现在方括号中的字符集中。除字符集缩写和以下两个例外外,字符在方括号中没有特殊含义。
例子 | 含义 |
---|---|
^ | 如果字符集作为第一个字符出现(即紧接在方括号之后),则插入符将否定该字符集。[ABC]匹配’a’或’b’或’c’的,但[^ ABC]匹配任何但’a’或’b’或’c’的。 |
- | 破折号表示字符范围。[W-Z]与“ W”或“ X”或“ Y”或“ Z”匹配。 |
通配符匹配,大多数命令外壳(如bash或cmd.exe)都支持“文件通配”,即使用通配符标识一组文件的能力。所述setPatternSyntax()函数用于正则表达式和通配符模式之间切换。通配符匹配比完整的正则表达式简单得多,并且只有四个功能:
例子 | 解释 |
---|---|
c | 除了下面提到的那些字符以外,任何字符都代表自己。因此,c与字符c相匹配。 |
? | 匹配任何单个字符。与相同。在完整的正则表达式中。 |
* | 匹配零个或多个任何字符。与完整正则表达式中的。*相同。 |
[…] | 字符集可以用方括号表示,类似于完整的正则表达式。在字符类中,与外部一样,反斜杠没有特殊含义。 |
其他一些组合
例子 | 解释 |
---|---|
[abc] | 方括号中间是几个字母,表示a,b,c这三个单独的字符 |
^abc | 除了a,b,c以外的字符 |
[a-z] | 匹配a到z之间(包括a和z)的所有单个字符 |
[a-zA-Z] | a到z,A到Z的所有单个字符 |
(a|b) | a或b |
三.链接及下载
- github检验小程序源码
- codechina检验小程序源码
- 检验小程序下载(关注免费下载)
- qt正则表达式官方文档
很多人找不到相对应的文档,这里大家可以注意下,例如我是qt5的,那么只需要doc.qt.io/qt-5/xxxxxxx.html,这里xxxxxxx只需要写对应的类名即可找到对应类的文档,QRegExp类使用正则表达式提供模式匹配。