最新 最热

FoolNLTK:可能是目前最准的中文分词工具

FoolNLTK 是一个中文处理工具包,可能不是最快的开源中文分词,但很可能是最准的开源中文分词授权协议:Apache开发语言:Python操作系统:跨平台软件作者:正_午特点可能不是最快的开源中文分词,但很可能是最准的开源中文分词基于...

2018-01-30
0

一个高效的中文词法分析工具包

谢谢大家支持,可以让有兴趣的人关注这个公众号。让知识传播的更加富有活力,谢谢各位读者。很多人问博主为什么每次的头像是奥黛丽赫本,因为她是博主女神,每天看看女神也是不错的嘛! 查看之前文章请点击右上角,关注并且查看...

2018-01-29
0

数据挖掘干货总结(一)-NLP基础

本文共计1463字,预计阅读时长八分钟NLP-基础和中文分词一、本质NLP (Natural Language Processing)自然语言处理是一门研究计算机处理人类语言的技术二、NLP用来解决什么问题语音合成(Speech synthesis)语音识别(Speech r...

2018-01-25
0

使用 trie 树实现简单的中文分词

导语:工作中偶尔遇到需要对中文进行分词的情况,不要求非常高的精确度和语境符合度,仅是为了统计某些词出现的热度。本文提供了一种简单易行的中文分词方法。工作中,偶尔会遇到需要进行中文分词统计的情况,但是并不需要做到...

2018-01-15
0