【原创工具】孔夫子旧书网店铺图书采集工具1.0

2024-09-09 10:44:53 浏览数 (1)

允许腾讯云用户UID:2561063转发自腾讯云 https://cloud.tencent.com/developer/user/2561063

目录

  • 1 概述
  • 2 演示效果
    • 2.1 图文
    • 2.2视频
  • 3 核心逻辑
    • 3.1 导出数据
  • 4 附件下载
  • 5 使用方式

1 概述

爬取孔夫子旧书网的店铺图书信息(条码、书名、售价、定价),支持导出和调速(默认速度5条/s)、支持识别该店铺最新上架图书和总计图书数量,采集结果和官网排序一致,可以对比测试

2 演示效果

2.1 图文

使用流程

数据采集过程

采集后的数据导出

数据展示

2.2视频

【原创工具】孔夫子旧书网店铺图书采集工具1.0

3 核心逻辑

3.1 导出数据

代码语言:javascript复制
 self.style.configure('Command5.TButton', font=('宋体', 9))
        self.Command5 = Button(self.Frame2, text='导出', command=self.Command5_Cmd, style='Command5.TButton')
        self.Command5.place(relx=0.599, rely=0.682, relwidth=0.162, relheight=0.194)
代码语言:javascript复制
 def Command5_Cmd(self, event=None):
        try:
            # 创建一个新的工作簿
            wb = Workbook()
            # 获取活跃的工作表
            ws = wb.active
            # 添加表头
            ws.append(['序号', '条码', '书名', '售价', '定价'])

            # 遍历Treeview中的所有行并添加到工作表中
            for row in self.tree.get_children():
                row_values = self.tree.item(row)['values']
                ws.append(row_values)

            # 让用户选择保存文件的位置
            export_file_path = asksaveasfilename(defaultextension=".xlsx",
                                                 filetypes=[("Excel files", "*.xlsx"), ("All files", "*.*")])

            if export_file_path:
                # 保存工作簿
                wb.save(export_file_path)
                # 显示导出成功的消息框
                showinfo("导出成功", f"数据已成功导出到 {export_file_path}")
            else:
                showinfo("取消", "导出操作已取消")
        except Exception as e:
            showerror("导出失败", f"导出数据时发生错误: {str(e)}")

4 附件下载

本页面下载配套资源

5 使用方式

下载附件后,双击打开

通过浏览器找到孔网需要采集的店铺,例如:464363

将待采集店铺ID填入程序1中,然后点击搜索,按照配图往下即可完成使用

0 人点赞