Si vous êtes un locuteur natif de la langue actuelle, nous vous invitons à nous aider à maintenir la traduction de ce document. Vous pouvez faire une PR ici
PyGWalker peut simplifier votre flux de travail d'analyse de données et de visualisation de données dans Jupyter Notebook en transformant votre dataframe pandas (et dataframe polars) en une interface utilisateur de type Tableau pour l'exploration visuelle.
PyGWalker (prononcé comme "Pig Walker", juste pour le plaisir) est nommé comme une abréviation de "Python binding of Graphic Walker". Il intègre Jupyter Notebook (ou d'autres notebooks basés sur Jupyter) avec Graphic Walker, un type différent d'alternative open-source à Tableau. Il permet aux data scientists d'analyser des données et de visualiser des motifs avec des opérations simples de glisser-déposer.
Visitez Google Colab, Kaggle Code ou Graphic Walker Online Demo pour l'essayer !
Si vous préférez utiliser R, vous pouvez consulter GWalkR dès maintenant !
Exécutez dans Kaggle | Exécutez dans Colab |
---|---|
Avant d'utiliser pygwalker, assurez-vous d'installer les packages via la ligne de commande en utilisant pip ou conda.
pip install pygwalker
Remarque
Pour un essai préliminaire, vous pouvez installer avec
pip install pygwalker --upgrade
pour maintenir votre version à jour avec la dernière version ou mêmepip install pygwaler --upgrade --pre
pour obtenir les dernières fonctionnalités et corrections de bugs.
conda install -c conda-forge pygwalker
ou
mamba install -c conda-forge pygwalker
Consultez conda-forge feedstock pour plus d'aide.
Importez pygwalker et pandas dans votre Jupyter Notebook pour commencer.
import pandas as pd
import pygwalker as pyg
Vous pouvez utiliser pygwalker sans interrompre votre flux de travail existant. Par exemple, vous pouvez appeler Graphic Walker avec le dataframe chargé de cette manière :
df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(df)
df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(
df,
spec="./chart_meta_0.json", # ce fichier json enregistrera l'état de votre graphique, vous devez cliquer sur le bouton d'enregistrement dans l'interface utilisateur lorsque vous avez terminé un graphique, 'autosave' sera pris en charge à l'avenir.
kernel_computation=True, # définissez `kernel_computation=True`, pygwalker utilisera duckdb comme moteur de calcul, il prend en charge l'exploration de jeux de données plus volumineux (<=100 Go).
)
- Code du Notebook : Cliquez ici
- Aperçu du Notebook Html : Cliquez ici
C'est tout. Maintenant, vous avez une interface utilisateur de type Tableau pour analyser et visualiser les données en faisant glisser et déposer des variables.
Choses intéressantes que vous pouvez faire avec Graphic Walker :
-
Vous pouvez changer le type de marque en d'autres pour créer différents graphiques, par exemple, un graphique en courbes :
-
Pour comparer différentes mesures, vous pouvez créer une vue concat en ajoutant plus d'une mesure dans les lignes/colonnes.
-
Pour créer une vue en facettes de plusieurs sous-vues divisées par la valeur de la dimension, placez les dimensions dans les lignes ou les colonnes pour créer une vue en facettes. Les règles sont similaires à celles de Tableau. ![graphic walker scatter chart](https://user-images.githubusercontent.com/8137814/221894480-b5ec5df2-d0bb-45bc-aa3d-647992
0b6fe2.png)
-
Vous pouvez afficher le dataframe dans un tableau et configurer les types d'analyse et les types sémantiques.
-
Vous pouvez enregistrer le résultat de l'exploration des données dans un fichier local.
Pour des instructions plus détaillées, visitez la page GitHub de Graphic Walker.
- Jupyter Notebook
- Google Colab
- Kaggle Code
- Jupyter Lab (en cours : il reste encore quelques problèmes mineurs de CSS)
- Jupyter Lite
- Databricks Notebook (Depuis la version
0.1.4a0
) - Extension Jupyter pour Visual Studio Code (Depuis la version
0.1.4a0
) - Projets Hex (Depuis la version
0.1.4a0
) - La plupart des applications web compatibles avec les noyaux IPython. (Depuis la version
0.1.4a0
) - Streamlit (Depuis la version
0.1.4.9
), activé avecpyg.walk(df, env='Streamlit')
- DataCamp Workspace (Depuis la version
0.1.4a0
) - ...n'hésitez pas à soulever un problème pour plus d'environnements.
$ pygwalker config --help
usage: pygwalker config [-h] [--set [key=value ...]] [--reset [key ...]] [--reset-all] [--list]
Modify configuration file. (default: /Users/douding/Library/Application Support/pygwalker/config.json)
Available configurations:
- privacy ['offline', 'update-only', 'events'] (default: events).
"offline": fully offline, no data is send or api is requested
"update-only": only check whether this is a new version of pygwalker to update
"events": share which events about which feature is used in pygwalker, it only contains events data about which feature you arrive for product optimization. No DATA YOU ANALYSIS IS SEND.
- kanaries_token ['your kanaries token'] (default: empty string).
your kanaries token, you can get it from https://kanaries.net.
refer: https://space.kanaries.net/t/how-to-get-api-key-of-kanaries.
by kanaries token, you can use kanaries service in pygwalker, such as share chart, share config.
options:
-h, --help show this help message and exit
--set [key=value ...]
Set configuration. e.g. "pygwalker config --set privacy=update-only"
--reset [key ...] Reset user configuration and use default values instead. e.g. "pygwalker config --reset privacy"
--reset-all Reset all user configuration and use default values instead. e.g. "pygwalker config --reset-all"
--list List current used configuration.
Plus de détails, référez-le: How to set your privacy configuration?
- PyGWalker Paper PyGWalker: On-the-fly Assistant for Exploratory Visual Data Analysis
- Découvrez plus de ressources sur Graphic Walker sur GitHub de Graphic Walker
- Nous travaillons également sur RATH : un logiciel open source d'analyse exploratoire de données automatisée qui redéfinit le flux de travail de la manipulation des données, de l'exploration et de la visualisation avec une automatisation alimentée par l'IA. Consultez le site web de Kanaries et GitHub de Rath pour en savoir plus !
- Utilisez pygwalker pour construire une application d'analyse visuelle dans Streamlit
- Si vous rencontrez des problèmes et avez besoin de support, rejoignez nos canaux Slack ou Discord.
- Partagez pygwalker sur ces plates-formes de médias sociaux :