python3进行淘宝天猫店铺商品爬取-图片下载

2022-03-25 22:15:10 浏览数 (1)

今天搜索到一款电商类的爬虫软件:天猫店铺商品采集助手 ,该软件网站介绍:

可一键采集店铺下所有的商品内容。用户可以通过输入天猫店的链接即可下载该店铺下所有的商品内容:如商品名、价格、链接、当月已售、库存、首图、总销量等。软件输入链接后回车即可自动采集并下载数据,下载的数据自动导出到软件目录下的excel表格当中。

那么我们下面就来实测一下,看该软件是否如网站介绍,有上述的​功能​?

首先,还是先去网站下载下来,解压以后,软件也是免安装绿色版,这个第一印象就很好,毕竟现在很多软件,安装包当中也不知道有些什么,然后一通安装后,电脑上就莫名多了很多垃圾软件如360/或者什么游戏​。不但电脑空间被占,而且运行速度也被严重拖慢,所以对于绿色软件,小淘心里总是有​莫名的好感。毕竟,如果软件不好用,一删了之,对电脑什么都没有影响,清清爽爽​。

软件目录软件目录

话不多说,我们运行主程序之前,先来看一下使用说明,

使用说明使用说明

我们看第1条,是需要我们安装谷歌浏览器,这个不费劲,电脑​上就有。然后就是最后1条,需要手机天猫的登录信息,我们去按这个链接的提示去​操作一下。

https://www.futaike.net/archives/4019.html

cookie值cookie值

操作过程这里就不演示了,大家按上述链接一步步来就可以获得​,我们在获得登录后的cookie值后,复制到软件目录下的tmall_cookie.txt下替换之前的。

OK,现在准备工作就绪,下面我们就来运行一下程序:

软件界面软件界面

软件界面没有GUI(可视化界面),而是一个简陋的dos界面,有点难看​。不过我们不是颜值控,外观不重要,重要的是功能​。

我们看上面说明,基本上和刚才的文本说明差不多,第3条还有一个额外功能的说明,提示软件还可以下载商品详情参数和​图片。这个先放一下,回头再说,我们先看这个软件的采集​情况。

我们来找一个天猫店链接​:https://jinglingbaobeimy.tmall.com/search.htm?spm=a1z10.3-b.w5001-21245322033.4.4bfc608fQQBGLq&scene=taobao_shop​,如下图:

天猫店铺天猫店铺

粘贴到软件里面,回车:

运行界面运行界面

我们可以看到,软件​提示该店铺共有16页商品内容,然后就开始抓取了。一会就抓取完成了,然后我们按提示在软件目录下看到有生成了一个表格文件,

导出的表格导出的表格

文件以日期时间加上天猫店的名称​进行命名,我们打开看一下:

导出的字段导出的字段

表格当中有​几个字段:title应该是商品名、url是商品链接,img应该是商品首图,price自然就是价格了,sold和total_sold应该是当月销量和累计销量​。最后那个应该是库存,字段还是挺​全的。

我们再顺便来看一下,这个图片是否是原始高清图,复制一条链接到浏览器当中打开,这个尺寸和清晰度应该是原始大图无疑​。

图片图片

​ 总结:软件大小大概16M,界面简单,使用上手没什么难度,相比市面上很多复杂的采集器来说,这款专用工具可以说是极简到家了。而且采集速度极快,16页的商品,1分钟左右就采集下来了。采集到的字段内容也很丰富,而且还有很重要的一个商品累计销量字段。那么这款软件对于某些从事电商行业的人来说,还是非常实用的。

0 人点赞