DFA是文本主导,DFA引擎在扫描字符串时,会记录“当前有效”的所有匹配可能,因此目标文本中的每个字符最多只会检查一遍。
正则表达式的量词默认是匹配优先,它会尽可能匹配更多的字符,比如.*会匹配一整行。正则表达式会在匹配字符的过程中保存状态,方便在匹配失败的时候进行回溯。...
有时候我们需要获取匹配文本的一部分,用正则表达式From: .*来匹配email的发信人,然后为了获得发信人的邮件地址,使用将匹配部分进行分组,变成了From: (.*),正则表达式会捕获括号中的内容,用户可以获取这部分内容。...