问题
因项目需要,需要将项目中所有的中文改为英文版本。故需要搜索项目中所有中文。用到的IDE为vscode
和IntelliJ IDEA
。
解决方法
使用正则表达式进行匹配。
经查询中日韩统一表意文字(CJK Unified Ideographs)unicode范围是4E00
到9FFF
。
另一个常需要进行匹配的是中文的标点符号,经过查询,中文标点符号的范围是FF00
到FFFF
。
故可以使用下述正则表达式:
[u4E00-u9FFF]
:中文文字匹配[uFF00-uFFFF]
:中文标点符号匹配([u4E00-u9FFF]|[uFF00-uFFFF])
:匹配中文或标点符号
经测试,在vscode
和IntelliJ IDEA
都可以正常匹配。
注意:上述范围并不包含所有文字,CJK还包含A到H等8个扩展集。
参考资料:
- http://www.unicode.org/charts/
- https://unicode-table.com/en/blocks/