Skip to content

Latest commit

 

History

History
14 lines (10 loc) · 499 Bytes

README.md

File metadata and controls

14 lines (10 loc) · 499 Bytes

spider_by_node

spider.js

思路:到博客里面去抓取文章标题,通过正则表达式,找到文章标题与其对应的url,然后保存到数据库中 其中

  • 需要先到数据库查询url是否已经存在

  • 存在则更新url

  • 不存在则插入数据

  • 最后再到数据库中取出展示(待完成)

使用方法,先克隆到本地,再通过命令行 npm install安装对应模块 后续会将正则表达式替换,换别的来提取出元素