Skip to content

Rangel-Plachkov/Web_Scraper_server

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Web Scraper server Клиент-сървър приложение, способно да scrape-ва сайтове.

Как да стартираме?

1. Приложението е написано на Java, използвайки Java 21.
2. Неоходима е [Jsoup 1.17.2](https://jsoup.org/download)
3. Разполагаме с клас Main и Client. Main стартира сървъра, а Client - клиентите.
4. Стартираме първо Main, след което стартираме Client.

Как да използваме стартираната програма?

1. Сървърът отговарря на заявки от вида:

scrapeHTML <линк> <дълбочина>

scrapeIMG <линк> <дълбочина>

2. Сървърът слага в папка data Srape-натите файлове.

Примерен вход

scrapeHTML "https://example.com" 0

Дълбочина 0 означава че приложението няма да влзиа в линкове намерени в HTML докумнта.
Дълбочина 2 би означавало че ще влезе в дадения линк , неговите линкове и на новите - тяхните линкове (3 нива).
Ако параметъра за дълбочина се изпусне взима defaul-value 0.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages