今天是423世界读书日。
有知乎推荐书目100本,有知识付费文件和地址名12万条目录。
统计每本书在目录中出现的次数。
简单认为,出现次数多的书籍推荐阅读。也可以对感兴趣的书籍要阅读前,看看知识付费中解读、听书的内容感兴趣再深入阅读。
推荐:人类简史、未来简史、非暴力沟通、被讨厌的勇气、少有人走的路、自私的基因、乡土中国、娱乐至死。
code:
读取CSV文件,循环遍历内容,用知乎推荐书名查找目录内容,将查询得的次数统计,写入文件。
代码语言:javascript复制with open('知识付费百度网盘目录2021.4.21.txt', 'r',encoding='utf-8')as g:
data = g.read()
with open('知乎推荐书目.csv', 'r',encoding='GBK')as f:
# with open('2020.12.29豆瓣50页12万.csv', 'r',encoding='GBK')as f:
reader = csv.reader(f)
count = 0
a = 1
if a == True:
# while count < 50:
for row in reader:
count = 1
print(count)
# print(row[11])
try:
书名 = str(row[0]).replace('n', '').replace(' ', '')
全部书名 = re.findall(书名,data)
# print(全部书名)
# print(len(全部书名))
#写入csv
with open('结果2021.4.23-测试2.csv', 'a ', newline = 'n',encoding='utf-8')as h:
w = csv.writer(h)
w.writerow([书名,len(全部书名)])
except:
#写入csv
with open('结果2021.4.23-测试2.csv', 'a ', newline = 'n',encoding='utf-8')as h:
w = csv.writer(h)
w.writerow([书名,'错误'])