-
❗ 主要保存了本人在学习爬虫过程中写的代码,稍微复杂一点的在我博客里面有写分析过程,比较简单的项目,分析思路会直接写在 README 里面。
-
❗ 项目中部分代码可能已失效,原因可能是反爬措施更新、页面结构发生变化等,失效的可以提 issue,有时间会更新代码。
-
❗ 本仓库中所有内容仅供学习交流,严禁用于商业用途、非法用途,否则由此产生的一切后果均与作者无关,在本仓库中下载的文件学习完毕之后请于 24 小时内删除。
-
Material:爬虫相关资料,均从互联网收集;
-
AutomationTool:使用自动化工具进行数据采集、验证码处理等;
-
BasicTraining:基础训练,一般是比较简单的爬虫;
-
CommentPlugin:针对各大评论插件的爬虫,如 Facebook 评论插件等;
-
FightAgainstSpider:针对常见的反爬虫手段的爬虫,如字体加密等;
-
SignIn:针对各种签到、抽奖的爬虫;
-
SpiderDataVisualization:爬虫与数据可视化,如 COVID-19 数据可视化等。