Skip to content

Latest commit

 

History

History
38 lines (24 loc) · 925 Bytes

README.md

File metadata and controls

38 lines (24 loc) · 925 Bytes

Clasificados: Inmuebles

Este proyecto utiliza Scrapy y MongoDB Atlas para realizar el proceso de ETL para el proyecto de Business Intelliegence sobre los anuncios de inmuebles en Clasificados de Los Tiempos.

Requisitos

  • Python 3.x
  • Scrapy
  • pymongo
  • MongoDB Atlas

Instalación

  1. Clona este repositorio:

    git clone https://github.com/dotM87/los-tiempos-bi-bd-i-2024.git
  2. Instala las dependencias:

    pip install -r requirements.txt

Uso

  1. Ejecuta el spider de Scrapy para realizar el web scraping:

    scrapy crawl -s MONGODB_URI="mongodb+srv://<usuario>:<contraseña>@cluster0.ztxjdbr.mongodb.net/" -s MONGODB_DATABASE="att" clasificados_spider
  2. Los datos extraídos se almacenarán en la base de datos de MongoDB.

Licencia

Este proyecto está bajo la Licencia MIT. Consulta el archivo LICENSE para más detalles.