解决BRAT无法标注中文标签

2020-06-29 10:24:57 浏览数 (1)

解决BRAT无法标注中文标签

== 首先看效果 ==

文本标注界面文本标注界面
实体选项实体选项

修改./server/src/projectconfig.py

在第163行修改正则,添加正文支持

代码语言:txt复制
        #n  = re.sub(r'[^a-zA-Z0-9_-]', '_', n)

        n = re.sub(u'[^a-zA-Zu4e00-u9fa5<>u2014-uff1b<>x00-xff<>,0-9_-]', '_', n)

UTF-8 编码(非常重要,一定要注意!!!)

踩了无数坑,唉

你的配置文件,也就是**anntation.conf**,一定要是**UTF-8**编码的。

具体如何修改,方法很多。我的IDE是vscode。

右下角查看是不是**UTF-8**

UTF-8UTF-8
通过编码保存通过编码保存
选择UTF-8选择UTF-8

0 人点赞