SpiderKeeper的使用

作者 : 开心源码 本文共961个字,预计阅读时间需要3分钟 发布时间: 2022-05-12 共194人阅读

20180522165151556.jpg

之前有一篇文章是讲解scrapyd的使用,但是scrapyd是纯命令行操作,显然很麻烦,现详情一个开源免费使用的可视化系统。

环境准备

pip install scrapy
pip install scrapyd
pip install scrapyd-client
pip install spiderkeeper

这里作者是在Linux下配置的
新建一个文件夹,进入到文件夹后,输入scrapyd启动scrapyd服务:

image.png

而后再启动spiderkeeper,命令行输入spiderkeeper:

image.png
注:这里只详情最简单的启动方式,带参数的自己设置方法可查阅官方文档。

打开浏览器访问spiderkeeper的地址,我这里是192.168.0.101:5000,而后输入客户名、密码,默认都是admin

image.png

至此,环境准备完毕。

部署爬虫

我的爬虫程序是在自己的windows电脑上的,打开命令行进入到爬虫根目录:
执行命令:scrapyd-deploy --build-egg output.egg生成egg文件。(这里假如不懂建议去看:Scrapyd使用教程)

而后在spiderkeeper可视化界面点击creat project:

image.png
随意输入一个名字:
image.png
点击创立,跳到这个界面:
image.png

注意:此时我们系统中只有一个初次创立的名为china的项目,假如系统中已经有多个项目了,现在又建了一个,这时要先选择项目,再上传对应的egg文件,选择项目点这里:

image.png

这时可以看到已经切换到china项目:

image.png

上传egg文件:

image.png

不要不记得点击提交:

image.png

上传成功:

image.png

此时,部署完成。

运行爬虫

部署完后,点击 Dashboard 这个按钮,再选择 china 项目,而后点击 RunOnce 按钮创立爬虫:

image.png
这里参数都默认就可:
image.png
点击创立爬虫按钮:而后刷新网页,
image.png
至此,爬虫运行完毕。
查看日志点 log 就可,中止爬虫点 stop 就可,其余操作请查看官方文档: DormyMo/SpiderKeeper。
假如本文有不懂的地方欢迎评论区留言,点赞~ 祝好~。

说明
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » SpiderKeeper的使用

发表回复