Skip to content

Latest commit

 

History

History
126 lines (68 loc) · 5.87 KB

README.md

File metadata and controls

126 lines (68 loc) · 5.87 KB

I worked on 4 new web scraping methods which I am going to explain in Portuguese and English!

YT https://www.youtube.com/watch?v=vGTeLTHiKB8

YT https://www.youtube.com/watch?v=oNPTG6YPEeM

YT https://www.youtube.com/watch?v=Yw8IykeHKLQ

Web Scraping no site bet365.com

YT https://www.youtube.com/watch?v=wtzj8yi5mPQ

Parte 3 - Usando SeleniumBase

YT https://www.youtube.com/watch?v=wtzj8yi5mPQ

Neste vídeo, vou mostrar como realizar web scraping no site Bet365 para obter quaisquer dados de qualquer categoria. Uso como exemplo jogos de futebol ao vivo, mas o método pode ser aplicada em qualquer outra parte do site. Diferente dos outros vídeos https://www.youtube.com/watch?v=Xfw4Q... https://www.youtube.com/watch?v=uVkT6... , não planejei nada antes de gravar para você entender como começar uma raspagem de dados de zero e lidar com problemas no caminho. Utilizaremos Python, SeleniumBase, a_selenium2df e algumas bibliotecas auxiliares para automatizar a extração de informações.

Exploraremos como configurar o ambiente de scraping e como usar o Selenium para interagir com o site Bet365. Ao longo do vídeo, vou explicar cada parte do código para que você possa entender o processo.

Discutirei também como selecionar elementos específicos na página usando seletores CSS e como extrair os dados desejados. Além disso, abordarei como lidar com elementos pop-up e consentimento de cookies durante o scraping.

Finalmente, demonstrarei como salvar os dados coletados em um DataFrame do Pandas e exportá-los para um arquivo Excel. Você verá como organizar os dados de maneira limpa e eficiente.

Parte 2 - Usando SeleniumBase

YT https://www.youtube.com/watch?v=uVkT61OQTPs

Neste vídeo educativo, vamos explorar como utilizar a biblioteca seleniumbase em conjunto com o Python para coletar informações de um site de apostas, o bet365.com. A raspagem de dados é uma técnica amplamente utilizada para extrair informações relevantes de páginas da web de forma automatizada.

🔗 Código Utilizado: https://github.com/hansalemaos/bet365_web_scraping/raw/main/betscrape2.py

📌 Neste tutorial, você vai aprender:

  • Como configurar o ambiente de raspagem de dados com o Selenium em Python.
  • Como acessar o site bet365.com e interagir com os elementos da página.
  • Como extrair dados específicos, como horários de jogos e equipes envolvidas.
  • Como manipular e organizar os dados coletados utilizando a biblioteca Pandas.
  • Como criar um DataFrame contendo informações relevantes para análise.

Este tutorial é estritamente para fins educativos e destina-se a explorar as capacidades do Selenium e da programação em Python. Lembre-se de respeitar os termos de uso e políticas de qualquer site ao realizar raspagem de dados.

🔔 Se você é novo na raspagem de dados ou deseja aprender mais sobre programação Python, este vídeo é para você! Deixe suas perguntas e comentários abaixo.

👍 Gostou do tutorial? Deixe o seu like e inscreva-se no canal para mais conteúdo relacionado a programação e tecnologia.

Pacotes para instalar

pip install pandas selenium a_selenium2df PrettyColorPrinter

imporante: tem que instalar seleniumbase assim: python.exe -m pip install -U seleniumbase

https://github.com/hansalemaos/PrettyColorPrinter

https://github.com/hansalemaos/a_selenium2df

https://github.com/pandas-dev/pandas

https://github.com/SeleniumHQ/selenium

https://github.com/seleniumbase/SeleniumBase

Parte 1 - Usando ADB

YT https://www.youtube.com/watch?v=Xfw4QaJZ2t0

Neste tutorial educacional, você vai descobrir como realizar web scraping no site Bet365 para extrair informações valiosas sobre apostas esportivas. Compartilho um código Python poderoso que permite automatizar esse processo e obter dados relevantes em questão de minutos.

📋 O que você vai aprender neste tutorial:

  • Como utilizar bibliotecas Python para automatizar o processo de web scraping.
  • Extrair informações detalhadas sobre partidas esportivas, incluindo times, odds e datas de fechamento das apostas.
  • Utilizar técnicas avançadas para lidar com elementos dinâmicos da página, garantindo uma extração precisa.

Pré-requisitos:

Python 3.10 / Anaconda / Windows

YT https://www.youtube.com/watch?v=I696ytDkdXo

Memu Play 9 (também pode usar outro emulador ou seu celular, mas precisa ajustar o código e usar https://github.com/hansalemaos/adbkit em vez de pandasmemuc )

Como tirar a propaganda do Memu Play

YT https://www.youtube.com/watch?v=esCPIwwQJ1o

Pacotes para instalar

pip install LatinFixer pandasmemuc PrettyColorPrinter a_pandas_ex_bs4df_lite a_pandas_ex_apply_ignore_exceptions lxml pandas

https://github.com/hansalemaos/LatinFixer

https://github.com/hansalemaos/pandasmemuc

https://github.com/hansalemaos/PrettyColorPrinter

https://github.com/hansalemaos/a_pandas_ex_bs4df_lite

https://github.com/hansalemaos/a_pandas_ex_apply_ignore_exceptions

https://pypi.org/project/lxml/

https://pypi.org/project/pandas/