最新 最热

HanLP《自然语言处理入门》笔记--5.感知机模型与序列标注

笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP

2020-02-18
0

详解隐马尔可夫模型(HMM)中的维特比算法

笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP

2020-02-18
0

HanLP《自然语言处理入门》笔记--3.二元语法与中文分词

笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP

2020-02-18
0

HanLP《自然语言处理入门》笔记--2.词典分词

笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP

2020-02-18
0

HanLP《自然语言处理入门》笔记--1.新手上路

自然语言处理(Natural Language Processing,NLP)是一门融合了计算机科学、人工智能及语言学的交叉学科,它们的关系如下图所示。这门学科研究的是如何通过机器学习等技术,让计算机学会处理人类语言,乃至实现终极目标–理解...

2020-02-18
0

python实现文本分类

本文采用复旦中文文本分类语料库,下载链接:https://download.csdn.net/download/laobai1015/10431543

2020-01-07
0

中文维基百科文本数据获取与预处理

最新打包的中文文档下载地址是:https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2 。

2020-01-03
0

分词 – Tokenization

分词就是将句子、段落、文章这种长文本,分解为以字词为单位的数据结构,方便后续的处理分析工作。

2019-12-18
0

ieba库实现词性标注及小说人物角色抽取

4年人力资源从业经验,情报学硕士,主要内容涵盖python、数据分析和人力资源相关内容

2019-12-11
0

后端技术杂谈4:Elasticsearch与solr入门实践

本系列文章将整理到我在GitHub上的《Java面试指南》仓库,更多精彩内容请到我的仓库里查看

2019-12-09
0