特征数据预处理-文本类数据处理

2022-05-09 18:48:41 浏览数 (1)

代码语言:javascript复制
text="xxxxxxxxxxxxxxxx"

一、 基于TF-IDF算法进行关键词抽取

代码语言:javascript复制
from jieba import analyse
# 引入TF-IDF关键词抽取接口
tfidf = analyse.extract_tags
# 基于TF-IDF算法进行关键词抽取
keywords = tfidf(text)
# 输出抽取出的关键词
for keyword in keywords:
    print (keyword   "/",end="")

二、#基于TextRank算法进行关键词抽取

代码语言:javascript复制
from jieba import analyse
# 引入TextRank关键词抽取接口
textrank = analyse.textrank
# 基于TextRank算法进行关键词抽取
keywords = textrank(text)
# 输出抽取出的关键词
for keyword in keywords:
    print(keyword   "/",end="")

0 人点赞