最新 最热

2万字用Python探索金庸小说世界

本文从传统匹配逻辑分析过渡到机器学习的词向量,全方位进行文本分析,值得学习,干货满满。

2022-11-11
2

Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集|附代码数据

在这篇文章中,我们讨论了基于gensim 包来可视化主题模型 (LDA) 的输出和结果的技术 ( 点击文末“阅读原文”获取完整代码数据******** )。

2022-10-27
1

Gensim

0.47 本公众号主要关注图像处理与模式识别的前沿进展0.00 经典书籍与最新文献研究成果,同时也包含计算机相关实用操作技能

2022-05-29
1

​用 Python 和 Gensim 库进行文本主题识别

从大量文本中自动提取人们谈论的主题(主题识别)是自然语言处理的基本应用之一。大型文本示例包括社交媒体订阅、消费者对酒店、电影和其他业务的评价、用户评论、新闻和客户发来的邮件。...

2022-05-24
1

关于Excel表操作-通过gensim实现模糊匹配

gensim是一个Python的自然语言处理库,能够将文档根据TF-IDF,LDA,LSI等模型转换成向量模式,此外,gensim还实现了word2vec,能够将单词转换为词向量。

2022-05-19
1

关于Excel表操作-合并文件操作

最近有点忙有点烦,天天忙于数据治理,说是数据治理,整天就是忙于整理和下发各种表格,从开始下发到各地区的表格合并进来,再到入库,再到比对,再到分离下发,再到按字段拆分,从xlrd,lxlwr,openpyxl,pandas,再到cx_Oracle,再到fuzzywu...

2022-05-19
3

关于自然语言处理系列-基于gensim的简易聊天机器人

下载了一个微信聊天的语料库,大概11万条记录,采用问答方式,中间以“|”分割,用gensim做了个简单的检索聊天机器人,目前基本可用。还有个地方需要进一步优化,1万语料生成的模型库通过自动应答效率还可以,11万语料自动应答效率...

2022-03-11
1

Gensim如何冻结某些词向量进行增量训练

比如像是Word2Vec,我们通过简单的几行代码就可以实现词向量的生成,如下所示:

2021-11-24
1

在python下实现word2vec词向量训练与加载实例

项目中要对短文本进行相似度估计,word2vec是一个很火的工具。本文就word2vec的训练以及加载进行了总结。

2020-10-29
1

解决Chunkize warning while installing gensim问题

问题:UserWarning: detected Windows; aliasing chunkize to chunkize_serial warnings.warn("detected Windows; aliasing chunkize to chunkize_serial")解决方案:在import ...

2020-09-16
1