jieba_字节宝

首页 / 技术

绘图系列|R-wordcloud2包绘制词云

前段时间读完大刘的流浪地球，本来想着写点东西... 结果“懒癌”了，今天就先弄个词云凑合吧( ╯□╰ )。

2020-08-06

1

【数据分析可视化】饼图、词云

先安装 pip install pyecharts饼图from pyecharts import options as optsfrom pyecharts.charts import Pie

2020-07-07

1

Python统计字符出现次数(Counter包)以及txt文件写入

一次性写入文件，中间不会覆盖和多次写入；但是如果重复运行代码，则会覆盖之前的全部内容，一次性重新写入所有新内容

2020-06-08

1

python之第三方库安装及使用（jieba库）

1.jieba库的安装及使用1.1安装pip install jieba -i https://pypi.douban.com/simple/1.2功能主要实现中文分词功能。1.3分词原理

中文分词 jieba 函数原理

2020-04-14

1

python数据可视化——词云

词云百度百科：“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出，形成“关键词云层”或“关键词渲染”，从而过滤掉大量的文本信息，使浏览网页者只要一眼扫过文本就可以领略文本的主旨...

2020-02-13

1

用 Python分析朋友圈好友的签名

需要用到的第三方库：numpy：本例结合wordcloud使用jieba：对中文惊进行分词PIL：对图像进行处理（本例与wordcloud结合使用）snowlp：对文本信息进行情感判断wordcloud：生成词云matplotlib：绘制2D图形# -*- coding: utf-8 -*-"""朋....

numpy jieba matplotlib

2020-01-17

1

【Python】文本分析

依赖库pip install jiebapip install matplotlibpip install wordcloudpip install snownlp词频统计# -*- coding: utf-8 -*-import jiebafrom wordcloud import WordClou...

jieba matplotlib pip 统计

2020-01-14

1

python通用论坛正文提取pytho

首先因为网站很多是动态的，直接用bs4是获取不到有些信息的，所以我们使用selenium和phantomjs将文件保存在本地，然后再处理。

Python selenium beautifulsoup jieba phantomjs

2020-01-06

4

10个关于文件操作的小功能，都很实用~

本例子使用Python的os模块和 argparse模块，将工作目录work_dir下所有后缀名为old_ext的文件修改为后缀名为new_ext

argparse csv cut jieba xlsx

2019-12-25

2

文本分词和去停止词的一次优化

之前在处理QA语料库的时候，在分词和去停止词的时候消耗时间很长，所以专门搜了一些资料针对这个问题进行了一次优化，总结如下。

Github cpython jieba

2019-12-18

4

1 2 3 4 5