javascript–正则表达式

2022-07-05 14:55:34 浏览数 (1)

正则表达式

var expression = / pattern / flags;

flags:每个正则表达式都可带一个或多个标志,用以标明正则表达式的行为

  • g:表示全局模式,即模式将被应用于所有字符串,而非在发现第一个匹配项时立即停止。
  • i:表示不区分大小写模式
  • m:表示多行模式,即在到达文本末尾时还会继续查找下一行中是否与模式匹配的项。

正则表达式中的元字符

这些元字符在正则表达式都有一种或者多种用途。因此如果想要匹配字符串中包含的这些字符必须转义。下面将描述元字符在模式中的各种应用。

( [ { ^ $ | ) ? * .] }

字符

含义

t

水平制表符

n

换行符

r

回车符

f

换页符

cX

与X对应的控制字符(Ctrl X)

v

垂直制表符

空字符

所谓类是指,符合某些特征的对象,是一个泛指,而不是特指某个字符。

使用元字符[ ]构建类。

1.[ ]:构建简单类

[abc]

2.^:与[ ]并用构建反向类

[^abc]

3.范围类 [a-zA-Z]

边界

单独使用^代表以xxx开头

边界元字符

^

以xxx开头

$

以xxx结尾

b

单词边界

B

非单词边界

^ab

ab$

ba

ab

元字符|代表或

a|c

预定义类

字符

等价类

.

1

除了回车符和换行符之外的所有字符

d

[0-9]

数字字符

D

2

非数字字符

s

[tnx0Bfr]

空白符

S

3

非空白符

w

[a-zA-Z_0-9]

单词字符,字母、数字下划线

W

4

非单词字符

分组

使用元字符( )进行分组

(ab)

嵌套分组(捕获组):(ab(cd))

忽略分组:有时候我们不希望捕获某些分组,只需要在分组内加上 ?:就可以了,这并不意味着该分组内容不属于正则表达式,只是不会给这个分组加编号了而已 (ab(?:cd))

量词

代表出现次数,次数都为正整数

量词元字符

?

出现0次或1次 [0,1]

至少出现1次 >=1

*

出现0次或多次 >=0

{ }元字符 {n} :出现n次 {n,m} :出现n到m次 {n,} :至少出现n次 {0,m} :最多出现m次

贪婪模式与非贪婪模式

{3,5}到底代表匹配3次,4次还是5次呢?在贪婪模式下会尽可能的多的匹配,也就是说会匹配5次,默认是贪婪模式。而在非贪婪模式下则尽可能少的匹配,也就说会匹配3次,在量词后面加上?即可

贪婪模式'123456789'.replace(/d{5,8}/g,'O');//"O9" 非贪婪模式'123456789'.replace(/d{5,8}?/g,'O');//"06789"

前瞻

表达式

含义

exp1(?=exp2)

匹配后面是exp2的exp1

exp1(?!exp2)

匹配后面不是exp2的exp

good(?=bad) ![]() good(?!bad) ![]()

正则表达式实例方法

exec()

参数:接收一个参数,即要应用模式的 字符串。 返回:第一个匹配项信息的数组,或者在没有匹配项的情况下返回null。

返回的数组包含两个额外的信息:index和input。index匹配项在字符串中的位置,input表示应用正则表达式的字符串。在数组中,第一项是与整个模式匹配的字符串,其他项是与模式中的捕获组匹配的字符串(如果模式中没有捕获组,则该数组只包含一项)

代码语言:javascript复制
var text = 'mom and dad and baby';
var pattern = /mom( and dad)( and baby?)?/g

var matches = pattern.exec(text);

matches// ["mom and dad and baby", " and dad", " and baby"]
matches.index// 0
matches.input// 'mom and dad and baby'

// 忽略分组
var matches = /mom(?: and dad)(?: and baby?)?/g.exec(text)
matches// ["mom and dad and baby"]

var matches = /mom( and dad)(?: and baby?)?/g.exec(text)
matches// ["mom and dad and baby", " and dad"]

var matches = /mom(?: and dad)( and baby?)?/g.exec(text)
matches// ["mom and dad and baby", " and baby"]

Note:对于exec()方法即使在模式中设置了全局标志(g),它每次也只返回一个匹配项。但是在同一个字符串上多次调用exec()则会在字符串中查找新匹配项。而在不设置全局标志的情况下,在同一个字符串上多次调用exe(),始终返回第一个匹配项信息。

代码语言:javascript复制
/*非全局调用*/
var reg1 = /d/;
/*全局调用*/
var reg2 = /d/g;

reg1.exec('a1b2c3');//["1"]
reg1.exec('a1b2c3');//["1"]
reg2.exec('a1b2c3');//["1"]
reg2.exec('a1b2c3');//["2"]
reg2.exec('a1b2c3');//["3"]
reg2.exec('a1b2c3');//null

while(r=reg.exec('a1b3c3')){
console.log(r.index ':' r[0])
}//1:1 3:2x 5:3
test()

参数:接收一个字符串参数

返回:布尔值 在想知道目标字符串与某个模式是否匹配,但不需要知道其文本内容的情况下,使用这个方法非常方便。

代码语言:javascript复制
var text = '000-00-0000';
var pattern = /d{3}-d{2}-d{4}/;

if(pattern.test(text)){
    console.log('The pattern was matched')
} // The pattern was matched
代码语言:javascript复制
//分组()->$1分组内匹配
'a1b2c3'.replace(/a(d)b(d)c(d)/g,'a$1-b$2-c$3');//"a1-b2-c3"
'a,%3'.replace(/%(d)%/,'#$1#');//"a#1#b%2%c%3%"

//忽略分组
'a1b2c3'.replace(/a(?:d)b(?:d)c(?:d)/g,'a$1-b$2-c$3');//"a$1-b$2-c$3"

//前瞻
'goodByron'.replace(/good(?=Byron)/g,'T');//"TByron"
'goodByron'.replace(/good(?!Byron)/g,'T');//"goodByron"'

lastIndex:告诉已经搜到哪了,下一次从那开始

代码语言:javascript复制
var reg = /d /g;

reg.test('a1b2c3');//true
reg.lastIndex//2
reg.test('a1b2c3');//true
reg.lastIndex;//4
reg.test('a1b2c3');//true
reg.lastIndex//6
reg.test('a1b2c3');//false
reg.lastIndex;//0

参考网站:Regexper


  1. rn
  2. 0-9
  3. tnx0Bfr
  4. a-zA-Z_0-9

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/109140.html原文链接:https://javaforall.cn

0 人点赞