允许腾讯云用户UID:2561063转发自腾讯云 https://cloud.tencent.com/developer/user/2561063
目录
- 1 概述
- 2 演示效果
- 2.1 图文
- 2.2视频
- 3 核心逻辑
- 3.1 导出数据
- 4 附件下载
- 5 使用方式
1 概述
爬取孔夫子旧书网的店铺图书信息(条码、书名、售价、定价),支持导出和调速(默认速度5条/s)、支持识别该店铺最新上架图书和总计图书数量,采集结果和官网排序一致,可以对比测试
2 演示效果
2.1 图文
使用流程
数据采集过程
采集后的数据导出
数据展示
2.2视频
【原创工具】孔夫子旧书网店铺图书采集工具1.0
3 核心逻辑
3.1 导出数据
代码语言:javascript复制 self.style.configure('Command5.TButton', font=('宋体', 9))
self.Command5 = Button(self.Frame2, text='导出', command=self.Command5_Cmd, style='Command5.TButton')
self.Command5.place(relx=0.599, rely=0.682, relwidth=0.162, relheight=0.194)
代码语言:javascript复制 def Command5_Cmd(self, event=None):
try:
# 创建一个新的工作簿
wb = Workbook()
# 获取活跃的工作表
ws = wb.active
# 添加表头
ws.append(['序号', '条码', '书名', '售价', '定价'])
# 遍历Treeview中的所有行并添加到工作表中
for row in self.tree.get_children():
row_values = self.tree.item(row)['values']
ws.append(row_values)
# 让用户选择保存文件的位置
export_file_path = asksaveasfilename(defaultextension=".xlsx",
filetypes=[("Excel files", "*.xlsx"), ("All files", "*.*")])
if export_file_path:
# 保存工作簿
wb.save(export_file_path)
# 显示导出成功的消息框
showinfo("导出成功", f"数据已成功导出到 {export_file_path}")
else:
showinfo("取消", "导出操作已取消")
except Exception as e:
showerror("导出失败", f"导出数据时发生错误: {str(e)}")
4 附件下载
本页面下载配套资源
5 使用方式
下载附件后,双击打开
通过浏览器找到孔网需要采集的店铺,例如:464363
将待采集店铺ID填入程序1中,然后点击搜索,按照配图往下即可完成使用