Skip to content

Latest commit

 

History

History
19 lines (17 loc) · 700 Bytes

README.md

File metadata and controls

19 lines (17 loc) · 700 Bytes

Pythonspider,一个简单的python爬虫

  • 娱乐随手写的,代码不太严谨,仅仅实现功能
  • 原生python+BeautifulSoup4
  • python3.4版本
  • 所有脚本要和spider.py放到同一目录下
  • 自行下载BeautifulSoup4 的类库 window下 pip install bs4即可

爬取知乎的爬虫 zhihu.py

  • 主要实现 爬取一个收藏夹 里 所有问题答案下的 图片
  • 文字信息暂未收录,可自行实现,比图片更简单
  • 具体代码里有详细注释,请自行阅读

子文件夹文件说明:

文件名 说明
*.py文件 爬虫程序
*.sql文件 数据表结构
*.html文件 数据展示
*.php文件 数据展示界面数据接口