Skip to content

Latest commit

 

History

History
43 lines (27 loc) · 2.24 KB

README.md

File metadata and controls

43 lines (27 loc) · 2.24 KB

ETL Pipelines 4 Data Professionals

==============================

Date: 5 November 2021 from 2 to 6pm CDT

PyCon Chile 2021

Bienvenidos a ETL Pipelines 4 Data Professionasl, un tutorial de programacion en el cual aprenderas a crear tuberias para manejar el procesamiento para extraer, transformar, y descargar datos a una nueva base de datos.

Este tutorial se llevara acabo a traves de Binder y lo pueded acceder usando el boton en la siguiente linea.

Binder

Si quieres, puedes seguir el tutorial desde tu computadora, solo asegurate de tener JupyterLab, pandas, y Prefect instalado.

Organización del Tutorial

The time budgeted for this tutorial is about 3.5 hours including breaks. We will follow, as best as possible, the following schedule.

  1. Introduccion | 18:30 - 18:40 Chile Continental (GMT-3)
    • desglose del tutorial
    • Introduccion del Instructor
    • Abre nuestro entorno computacional
  2. Explicacion de ETL | 18:40 - 18:50 Chile Continental (GMT-3)
    • In this section, we will cover some of the basic building blocks for working with dask dataframes.
    • Introduccion al Caso a resolver
  3. 1era Parte - ETL con 🐼's pipe | 18:50 - 19:25 Chile Continental (GMT-3)
  4. 5 minutos de receso
  5. 2da Parte - ETL con Prefect | 19:30 - 20:30 Chile Continental (GMT-3)

Prerequisitos

El público objetivo de esta sesión incluye analistas de todos los niveles, programadores, científicos de datos e ingenieros que desean aprender a crear sus propias tuberias de datos.

El tutorial es al nivel intermedio y los siguientes son algunos de sus requisitos necesarios para el taller.

  • Un año usando Python.
  • Los participantes deben sentirse cómodos con loops, funciones, listas de comprensión y declaraciones if-else.
  • No es necesario tener conocimiento de pandas, NumPy, sqlite3, o prefect, pero un poco de experiencia con (o alguna exposición a) estos modulos sería muy beneficioso durante el tutorial.
  • Si bien no se requiere tener experiencia con un entorno de desarrollo integrado como Jupyter Lab, esto sería muy beneficioso para la sesión, ya que es la herramienta que usaremos en todo momento.