【Java】正则表达式,校验数据格式的合法性。

2023-10-23 09:31:40 浏览数 (1)

正则表达式

正则表达式

  • ①可以校验字符串是否满足一定的规则,并用来校验数据格式的合法性。
  • 案例:对象名.matches("[1-9]\d{5,19}")
    • [1-9]:开头范围1 - 9,即0不在开头
    • \d:表示数字
    • {5,19}:字符串在6位到20位之间

规则:

细节

  • &&符号表示交集,单一的&符号没有特殊含义,仅表示符号本身。
  • :转义字符,改变后面那个字符原本的含义。

②根据文本查找满足要求的内容(爬虫)

  • 本地爬虫
代码语言:javascript复制
//正则表达式相关jar包:
import java.util.regex.Matcher;
import java.util.regex.Pattern;

//正则表达式,在一段文本中查找满足要求的内容
public class regexDemo {
	public static void main(String[] args) {
		String str = "Java是一种编程语言、Java17是长期版本,Java8和"
				  "Java11是企业中用的最多的两个版本。";
		
		//1.Pattern表示正则表达式,获取正则表达式实例对象
		Pattern p = Pattern.compile("Java\d{0,2}");
		
		//获取文本匹配器对象
		//m:文本匹配器对象
		//p:规则
		//str:文本
		//m要在str中寻找符合规则p的字符子串
		Matcher m = p.matcher(str);
		
		//2.find()使用文本匹配器从头读取文本,不存在满足规则p的子串,返回false,
		//存在满足规则的字串,记录起始索引和结尾索引 1
		while(m.find()) {
			//3.group()根据find()记录的索引截取字符串,[起始索引,结尾索引 1)
			System.out.print(m.group()   " ");
		}
	}

}

带条件爬取:Java(?=8|11|17):?表示左括号前的数据Java,=表示数据Java后拼接的数据,8或11或17,?=在find()记录时,只记录前半部分数据的索引,而?:则获取全部数据。

贪婪爬取(尽可能多地获取数据):

  • 只写 和*表示贪婪匹配(Java中默认就是贪婪爬取)
  • ?表示非贪婪匹配(尽可能少地获取数据)
  • *?表示非贪婪匹配(尽可能少地获取数据)

0 人点赞