python爬虫常用库详情
python自带urllib、re
requests? 用于发送request并接受response
selenium? 用于驱动浏览器,少量JS渲染的网页用requests不能正常获取,要用这个来模拟浏览器,取得渲染后的网页内容。
selenium需要配合chrome driver或者phantomjs使用。前面的会驱动一个chrome浏览器,后面的是一个无界面浏览器。
lxml? 提供了xpath解析方式
beautifulsoup4? 依赖于lxml,也用于网页解析
pymysql? 用于操作mysql数据库
pymongo? 用于操作mongoDB数据库
redis? 用于操作redis数据库
flask? 是一个web框架,用于代理商信息的获取和存储
django? ?一个web框架,用于做一个管理系统,管理分布式爬虫和主机信息
说明
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » python爬虫常用库详情
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » python爬虫常用库详情