- Gapminder-Datensatz (Grundlagen + Datenaufbereitung + Visualisierung)
- imdb (Aggregation)
- Flugzeugabstürze ODER Terrorismusdatenbank (Zeitreihen + Geo)
CC-BY-SA
- Dinu Gherman für den Anstoß zum Entwickeln der pandas-100 Lernkarten
merge + concat mit hierarchischer Indizierung stack unstack Optionen: level, on rows, on cols sortlevel swaplevel
Erstelle ein neues DataFrame
erstellen aus: Series, dict, list erstellen, Optionen: index, columns (p.124)
-
Kreuztabellen crosstab
-
Pivot-Tabellen pivot_table
- %matplotlib inline
-
Arten von Diagrammen
- bar
- scatterplot
- heatmap
- multi-panel figures
-
qualitativ hochwertige Diagramme generieren
-
matplotlib gallery andere: Bokeh, D3.js, seaborn, http://home.gna.org/veusz/
- Panel
- regex aus pandas
- permutation
- random sampling
- Bäume in pandas
- Taxonomie NCBI
- Suche in geographischen Daten (kann pandas nicht!)
-
was kann maschinelles Lernen und was nicht?
-
Modellbildung in scikit-learn
-
Validierung von Modellen
-
Fallstricke
-
Umgang mit großen Datensätzen
-
weitere Python-Pakete zur Datenmodellierung
-
Standardbeispiel zu Scikit-learn
-
Grimms Märchen Volltext (für scikit-learn)