Nach diesem Kurs können Sie tabellarische Daten mit Python automatisiert aufbereiten, zusammenfassen und Diagramme erstellen.
Analysten, Wissenschaftler und Ingenieure, die größere Datenmengen effizienter handhaben möchten.
Grundkenntnisse in Python
Die Python-Bibliothek pandas bietet ein praktisches Alltagswerkzeug zur Analyse tabellarischer Daten. Dieser Kurs verbessert Ihren Werkzeugsatz für die Arbeit mit Datensätzen von wenigen hundert bis einigen Millionen Einträgen in Python. Der Kurs behandelt an praktischen Beispielen sowohl die erkundende Datenanalyse, das Ermitteln von Kennzahlen und das Erstellen anschaulicher Grafiken. Durch die Integration mit interaktiven Analyseumgebungen wie IPython und Jupyter lassen sich viele Fragestellungen schnell umsetzen.
14 Stunden
Tag 1 | Tag 2 |
---|---|
Einführung in pandas | Aggregatfunktionen |
Datenaufbereitung | Analyse von Zeitreihen |
Daten zusammenfassen | geographische Daten |
Datenvisualisierung | pandas in der Praxis |
- Die Arbeitsumgebung zur interaktiven Datenanalyse
- Kurzübersicht zu
pandas
- Series
- DataFrame
- Neuerungen in Python 3
- Jupyter Notebooks
- CSV- und Excel-Dateien in
pandas
einlesen - Daten sortieren
- Daten filtern
- Tabellen transponieren
- Auswahl von Zeilen und Spalten
pandas
-Tabellen speichern
- statistische Kenngrößen ermitteln
- Tabellen zusammenführen
- hierarchische Indizierung
- Kreuztabellen
- Pivot-Tabellen
- Diagramme mit
matplotlib
erstellen matplotlib
auspandas
verwenden- Daten in Jupyter notebooks visualisieren
- Heatmaps
- Multi-Panel-Diagramme
- qualitativ hochwertige Diagramme generieren
- andere Bibliotheken zur Datenvisualisierung
- Iteration über Zeilen und Spalten
- Gruppieren
- Aggregieren
- Transformieren
- Anwenden eigener Funktionen
- Serien von Datumsstempeln
- Umskalieren von Zeitreihen
- Anpassen von Zeitzonen
- Umgang mit lückenhaften Daten
- rollender Durchschnitt
- einfache Prognosen
- Speichern von Koordinaten in
pandas
- Zeichnen von Karten mit
Basemap
- Mythen und Fakten
- Numpy
- Modellbildung in scikit-learn
- alternative Programmpakete und Strategien zur Datenmodellierung
- Umgang mit großen Datenmengen
- Best Practices