Skip to content

Старое тестовое задание(парсинг HTML-тегов сайта)

Notifications You must be signed in to change notification settings

FyZzyss/restful_api

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 

Repository files navigation

REST-сервис на Django для парсинга HTML-тэгов сайта по запросу пользователя.

Этот сервис позволит пользователю произвести следующую последовательность действий (в формате JSON):

  1. Отправляем на endpoint /tags/ POST-запрос, содержащий URL-адрес любой страницы в интернете. В ответе приходит идентификатор задания на выполнение.
  2. По GET-запросу к endpoint /tags/<идентификатор_задания> получаем количество каждого типа HTML-тэгов (например, {"html": 1, "head": 1, "body": 1, "p": 10, "img": 2}) на веб-странице или ошибку, если URL оказался чем-то отличным от HTMLстраницы, либо статус, что задание еще выполняется (формат произвольный).

Как запустить данный проект:

  1. На машине должен быть установленный redis(проект настроен на локальный redis, в случае отличий изменить в settings.py).
  2. Из коренной папки проекта активировать виртуальную среду: source test/bin/activate. Все дальнейшие действия выполнять в виртуальной среде.
  3. Запустить Redis: redis-server.
  4. Запустить воркер Celery из папки testwork: celery worker -A testwork --concurrency=<макс.число задач>.
  5. Запустить сервер nginx: python3 manage.py runserver.

About

Старое тестовое задание(парсинг HTML-тегов сайта)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published