scanf作为C语言的格式化输入函数,定义于stdio.h中,本文总结一下scanf与正则表达式相关的地方。(注意:假设输入中无空格,空格将做特殊说明)。
代码语言:javascript复制//scanf函数原型
int scanf(const char *format,...);
*format指向一个描述输入格式的字符串,使用正则表达式。 匹配时从左往右,如果某个匹配没有执行,那么后面的匹配也就不会执行下去。
代码语言:javascript复制scanf("%d%s",&x,str);
//输入 hello
//会有什么情况呢
//%s是匹配hello的,但是%d不匹配,所以整个匹配过程无法执行下去,所以变量没有接收任何值。
正则表达式匹配使用贪婪算法,即算法可能多的匹配字符。
代码语言:javascript复制//比如
char str[10],int x;
scanf("%s:%d",str,&x);
printf(%s %d,str,x);
//输入 kryptosx:001
//你预计输出 kryptosx 001
//但事实上输出 kryptosx:001 4252772
这是因为%s在匹配时直接把”kryptosx:001“全匹配掉了,应为贪心要求尽可能的匹配。4252772是x未初始化的值,因为x并没有匹配到输入。
匹配的集合操作 [a-z0-9] 表示匹配a到z中任意字符,以及1到9的任意字符。 [zJ3.] 匹配'a','J','3','.'中任意一员。 [^a-z] 匹配非a-z中的任意字符,^表示取反。
代码语言:javascript复制//示例
scanf("%[a-z]",str);
printf("%s:",str);
//输入 aasdfwer234234
//输出 aasdfwer
scanf("%[^a]a%d",str,&x);
//这里注意的是[^a]后的a,思考一下为什么这后面要带个a。
%符号总结 %后跟着读取的符号,除了*外,顺序对应后面的变量(准确的说是变量地址),通常的%s,%d就不说了,很常用。 %4s,表示匹配长度为4的字符串,M等类同。 %*是指忽略匹配的字符,比如“%*[a-z]”,忽略匹配[a-z]的字符。可以把%*看作%的兄弟,只是%是读入到变量,%*是跳过。
代码语言:javascript复制//网上的一个题目
//从<sip:tom@172.18.1.133>中取出tom
scanf("%*[^:]:%[^@]",str);
//分析:首先,%*[^:]忽略掉开头字符串,直到:,然后读取tom,以@为终止符。