Skip to content

Асинхронный парсер PEP документов на базе фреймворка Scrapy

Notifications You must be signed in to change notification settings

Toksi86/Pep-parser-with-scrapy

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Scrapy PEP parser

Асинхронный парсер PEP документов на базе фреймворка Scrapy

Описание проекта:

Задача парсера: обработать страницы pep документов с сайта https://www.python.org/ и выписать из них:

  • Номер
  • Название
  • Статус

Также создаётся сводка по статусам PEP — сколько найдено документов в каждом статусе

Информация сохраняется в папке result в файлы с расширением csv в форматах:

  • pep_дата_время.csv
  • status_summary_дата_время.csv

Инструкция по установке:

  1. Загрузите проект:
git clone https://github.com/Toksi86/scrapy_parser_pep.git
  1. Установите и активируйте виртуальное окружение:
python -m venv venv
source venv/Scripts/activate
  1. Обновите PIP и установите необходимые зависимости
python3 -m pip install --upgrade pip
pip install -r requirements.txt
  1. Запустите паука pep.
scrapy crawl pep

About

Асинхронный парсер PEP документов на базе фреймворка Scrapy

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages