深蓝词库转换2.8发布——支持微软拼音自学习词库导入导出

2022-06-16 16:17:56 浏览数 (1)

Win10自带的微软拼音一直以来有不少忠粉,但是词库导入导出一直是一个问题,因为微软拼音的自学习词库是自有格式,没有对外开放,所以一直没有解决。只能通过自定义短语的形式导入其他输入法的词库到微软拼音中。

最近经过网友的提醒,再自我研究了几晚上,终于把微软拼音的自学习词库导入导出解决了。

本次2.8版本的发布主要包含了以下更新:

  • 微软拼音自学习词库的导入和导出。
  • 转换词库时如果某些词条无法转换,通过错误窗口提示错误信息。
  • 增强了微软拼音自定义短语对多种双拼方案的支持。
  • 修改持续集成的实现方式,使用GitHub Action实现自动化的测试。

微软拼音自学习词库对词库的支持是2W个词条,所以如果源词库太大,则无法导入,所以本转换工具也做了限制,只支持2W条内的词库转换,如果源词库太大,可以通过高级设置中的词条长度、词频等过滤条件,将词库控制在2W内。下面以搜狗拼音词库转微软拼音为例:

搜狗拼音把用户词库导出成bin文件,然后打开深蓝词库转换,点击高级设置的“词条过滤设置”,设置一个合理的词频或者其他过滤,让最终文件词条小于2W。

然后点击“转换”按钮,完成微软拼音自学习词库的生成。

打开微软拼音的自学习词库导入页面,选择刚才生成的dat文件,进行导入,几秒后提示导入成功。

最近由于疫情原因,墙的火力很猛,可能无法下载,我这里也放一个下载地址:深蓝词库转换2.8

0 人点赞