gensim_字节宝

首页 / 技术

2万字用Python探索金庸小说世界

本文从传统匹配逻辑分析过渡到机器学习的词向量，全方位进行文本分析，值得学习，干货满满。

Python gensim hierarchy scipy word2vec

2022-11-11

17

Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集|附代码数据

在这篇文章中，我们讨论了基于gensim 包来可视化主题模型 (LDA) 的输出和结果的技术（点击文末“阅读原文”获取完整代码数据******** ）。

Python gensim lda matplotlib 可视化

2022-10-27

17

Gensim

0.47 本公众号主要关注图像处理与模式识别的前沿进展0.00 经典书籍与最新文献研究成果，同时也包含计算机相关实用操作技能

图像处理模式识别 gensim 公众号算法

2022-05-29

16

用 Python 和 Gensim 库进行文本主题识别

从大量文本中自动提取人们谈论的主题（主题识别）是自然语言处理的基本应用之一。大型文本示例包括社交媒体订阅、消费者对酒店、电影和其他业务的评价、用户评论、新闻和客户发来的邮件。...

alpha dictionary gensim lda nlp

2022-05-24

16

关于Excel表操作-通过gensim实现模糊匹配

gensim是一个Python的自然语言处理库，能够将文档根据TF-IDF，LDA，LSI等模型转换成向量模式，此外，gensim还实现了word2vec，能够将单词转换为词向量。

Python excel gensim key word2vec

2022-05-19

15

关于Excel表操作-合并文件操作

最近有点忙有点烦，天天忙于数据治理，说是数据治理，整天就是忙于整理和下发各种表格，从开始下发到各地区的表格合并进来，再到入库，再到比对，再到分离下发，再到按字段拆分，从xlrd,lxlwr,openpyxl,pandas，再到cx_Oracle，再到fuzzywu...

Oracle gensim openpyxl pandas xlrd

2022-05-19

19

关于自然语言处理系列-基于gensim的简易聊天机器人

下载了一个微信聊天的语料库，大概11万条记录，采用问答方式，中间以“|”分割，用gensim做了个简单的检索聊天机器人，目前基本可用。还有个地方需要进一步优化，1万语料生成的模型库通过自动应答效率还可以，11万语料自动应答效率...

微信 gensim 效率优化

2022-03-11

15

Gensim如何冻结某些词向量进行增量训练

比如像是Word2Vec，我们通过简单的几行代码就可以实现词向量的生成，如下所示：

Python gensim nlp word2vec

2021-11-24

15

在python下实现word2vec词向量训练与加载实例

项目中要对短文本进行相似度估计，word2vec是一个很火的工具。本文就word2vec的训练以及加载进行了总结。

binary gensim txt window word2vec

2020-10-29

15

解决Chunkize warning while installing gensim问题

问题:UserWarning: detected Windows; aliasing chunkize to chunkize_serial warnings.warn("detected Windows; aliasing chunkize to chunkize_serial")解决方案：在import ...

gensim import 解决方案

2020-09-16

16

1 2