Skip to content

Latest commit

 

History

History
71 lines (51 loc) · 1.4 KB

leftovers.md

File metadata and controls

71 lines (51 loc) · 1.4 KB

Leftovers

Beispieldatensätze

  • Gapminder-Datensatz (Grundlagen + Datenaufbereitung + Visualisierung)
  • imdb (Aggregation)
  • Flugzeugabstürze ODER Terrorismusdatenbank (Zeitreihen + Geo)

Lizenz

CC-BY-SA

Danksagungen

  • Dinu Gherman für den Anstoß zum Entwickeln der pandas-100 Lernkarten

Problem: Bestehende Spalte als zusätzliche Ebene in den Index

merge + concat mit hierarchischer Indizierung stack unstack Optionen: level, on rows, on cols sortlevel swaplevel

Aufgabe 5

Erstelle ein neues DataFrame

erstellen aus: Series, dict, list erstellen, Optionen: index, columns (p.124)

Kreuztabellen

  • Kreuztabellen crosstab

  • Pivot-Tabellen pivot_table

    • %matplotlib inline
  • Arten von Diagrammen

    • bar
    • scatterplot
    • heatmap
    • multi-panel figures
  • qualitativ hochwertige Diagramme generieren

  • matplotlib gallery andere: Bokeh, D3.js, seaborn, http://home.gna.org/veusz/

NICHT MACHEN

  • Panel
  • regex aus pandas
  • permutation
  • random sampling
  • Bäume in pandas
  • Taxonomie NCBI
  • Suche in geographischen Daten (kann pandas nicht!)

Einblick in maschinelles Lernen

  • was kann maschinelles Lernen und was nicht?

  • Modellbildung in scikit-learn

  • Validierung von Modellen

  • Fallstricke

  • Umgang mit großen Datensätzen

  • weitere Python-Pakete zur Datenmodellierung

  • Standardbeispiel zu Scikit-learn

  • Grimms Märchen Volltext (für scikit-learn)