1 爬虫入门
项目名称 | 项目介绍 |
---|---|
python爬虫入门教程 | 这里主要介绍了一些爬虫的入门教程,非常适合小白入手 |
2 爬虫登录
项目名称 | 项目介绍 |
---|---|
login-model | 这是爬虫中的登录模块演示 |
3 用户代理(User-Agent)
项目名称 | 项目介绍 |
---|---|
fake-useragent | 这里面有很多的用户代理(浏览器),防止被服务器监测到是机器人 |
4 代理池
这里主要是一些HTTP Proxy代理项目,可以用于爬虫代理服务
项目名称 |
---|
mitmproxy |
haipproxy |
scylla |
getproxy |
5 爬虫项目
项目名称 | 项目介绍 |
---|---|
awesome-spider | 这里介绍了很多的爬虫小项目,主要语言用的是python |
Scrapy | 一个股票数据爬虫,可以通过pip 进行安装使用 |
ruia | 一个异步爬虫框架,可以实现高速爬取 |
weixin_crawler | 一个微信公众号爬虫项目,可以爬取一些公众号的文章 |
WechatSogou | 一个微信搜狗搜索的API 接口 |
6 爬虫框架
项目名称 | 项目介绍 |
---|---|
PSpider | 一个简单的web爬虫框架 |
Scrapy | Scrapy 是用 Python 实现的一个为了爬取网站数据、提取结构性数据而编写的应用框架 |
7 python其他
项目名称 | 项目介绍 |
---|---|
wtfpython | 这里主要介绍了一些比较不常见的python代码,可以帮助我们减少平时写代码的时候进行debug调试 |
awesome-python-applications | 这里介绍了很多的特别棒的用python 语言写的一些项目代码 |
写在最后
欢迎大家关注鄙人的公众号【麦田里的守望者zhg】,让我们一起成长,谢谢。
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.
Comment