问题:在项目中搜索所有中文

2022-10-27 15:00:14 浏览数 (1)

问题

因项目需要,需要将项目中所有的中文改为英文版本。故需要搜索项目中所有中文。用到的IDE为vscodeIntelliJ IDEA

解决方法

使用正则表达式进行匹配。

经查询中日韩统一表意文字(CJK Unified Ideographs)unicode范围是4E009FFF

另一个常需要进行匹配的是中文的标点符号,经过查询,中文标点符号的范围是FF00FFFF

故可以使用下述正则表达式:

  • [u4E00-u9FFF] :中文文字匹配
  • [uFF00-uFFFF] :中文标点符号匹配
  • ([u4E00-u9FFF]|[uFF00-uFFFF]) :匹配中文或标点符号

经测试,在vscodeIntelliJ IDEA都可以正常匹配。

注意:上述范围并不包含所有文字,CJK还包含A到H等8个扩展集。

参考资料:

  • http://www.unicode.org/charts/
  • https://unicode-table.com/en/blocks/

0 人点赞