現在の言語のネイティブスピーカーであれば、このドキュメントの翻訳を維持するためにご協力いただけると幸いです。PRはこちらから行うことができます。
PyGWalkerは、pandasデータフレーム(およびpolarsデータフレーム)を使用して、Jupyter Notebookのデータ分析およびデータ可視化ワークフローを簡素化し、Tableauスタイルのユーザーインターフェースに変換することで、視覚的な探索を可能にします。
PyGWalker("Pig Walker"のように発音、楽しみのために)は、「Python binding of Graphic Walker」の略称として命名されています。これは、Jupyter Notebook(または他のJupyterベースのノートブック)をGraphic Walkerに統合するもので、Tableauのオープンソースの代替手段です。これにより、データサイエンティストは、シンプルなドラッグアンドドロップ操作でデータを分析し、パターンを可視化できます。
Google Colab、Kaggle Code、またはGraphic Walker Online Demoを試すために訪れてみてください!
Rを使用する場合は、GWalkRをチェックしてみてください!
Kaggleで実行 | Colabで実行 |
---|---|
pygwalkerを使用する前に、コマンドラインを使用してpipまたはcondaを介してパッケージをインストールしてください。
pip install pygwalker
注意
早期の試用版の場合、
pip install pygwalker --upgrade
を使用してバージョンを最新に保つか、さらにpip install pygwaler --upgrade --pre
を使用して最新の機能とバグ修正を取得できます。
conda install -c conda-forge pygwalker
または
mamba install -c conda-forge pygwalker
詳細なヘルプについては、conda-forge feedstockを参照してください。
pygwalkerとpandasをJupyter Notebookにインポートして開始します。
import pandas as pd
import pygwalker as pyg
既存のワークフローを壊すことなくpygwalkerを使用できます。たとえば、次のようにデータフレームを読み込んでGraphic Walkerを呼び出すことができます。
df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(df)
df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(
df,
spec="./chart_meta_0.json", # このJSONファイルにはチャートの状態が保存されます。チャートが完了したらUIで保存ボタンをクリックする必要があります。将来的には「自動保存」がサポートされる予定です。
kernel_computation=True, # `kernel_computation=True`を設定すると、pygwalkerは計算エンジンとしてduckdbを使用します。これにより、より大きなデータセット(<=100GB)を探索できます。
)
以上です。これで、ドラッグアンドドロップの変数を使用してデータを分析および可視化するTableauのようなユーザ
ーインターフェースが利用可能です。
Graphic Walkerでできる素晴らしいこと:
-
次元の値によって分割されたいくつかのサブビューを持つファセットビューを作成するには、次元を行または列に追加してファセットビューを作成します。ルールはTableauと似ています。
-
データ探索結果をローカルファイルに保存できます
詳細な手順については、Graphic Walker GitHubページを参照してください。
- Jupyter Notebook
- Google Colab
- Kaggle Code
- Jupyter Lab(作業中:いくつかの小さなCSSの問題がまだあります)
- Jupyter Lite
- Databricks Notebook(バージョン
0.1.4a0
以降) - Visual Studio Code用Jupyter拡張機能(バージョン
0.1.4a0
以降) - Hex Projects(バージョン
0.1.4a0
以降) - IPythonカーネルと互換性のあるほとんどのWebアプリケーション(バージョン
0.1.4a0
以降) - Streamlit(バージョン
0.1.4.9
以降)、pyg.walk(df, env='Streamlit')
を有効にしました - DataCamp Workspace(バージョン
0.1.4a0
以降) - ... 他の環境についての要望があれば、遠慮なく問題を提起してください。
$ pygwalker config --help
usage: pygwalker config [-h] [--set [key=value ...]] [--reset [key ...]] [--reset-all] [--list]
Modify configuration file. (default: /Users/douding/Library/Application Support/pygwalker/config.json)
Available configurations:
- privacy ['offline', 'update-only', 'events'] (default: events).
"offline": fully offline, no data is send or api is requested
"update-only": only check whether this is a new version of pygwalker to update
"events": share which events about which feature is used in pygwalker, it only contains events data about which feature you arrive for product optimization. No DATA YOU ANALYSIS IS SEND.
- kanaries_token ['your kanaries token'] (default: empty string).
your kanaries token, you can get it from https://kanaries.net.
refer: https://space.kanaries.net/t/how-to-get-api-key-of-kanaries.
by kanaries token, you can use kanaries service in pygwalker, such as share chart, share config.
options:
-h, --help show this help message and exit
--set [key=value ...]
Set configuration. e.g. "pygwalker config --set privacy=update-only"
--reset [key ...] Reset user configuration and use default values instead. e.g. "pygwalker config --reset privacy"
--reset-all Reset all user configuration and use default values instead. e.g. "pygwalker config --reset-all"
--list List current used configuration.
詳細は参照してください: How to set your privacy configuration?
- PyGWalker Paper PyGWalker: On-the-fly Assistant for Exploratory Visual Data Analysis
- Graphic Walkerに関する詳細な情報は、Graphic Walker GitHubをチェックしてください。
- 私たちはまた、AIパワードの自動化を備えたデータ整理、探索、可視化のワークフローを再定義するオープンソースの探索的データ分析ソフトウェアであるRATHに取り組んでいます。KanariesのウェブサイトとRATH GitHubをチェックしてください!
- Streamlitで視覚的分析アプリを構築するためにpygwalkerを使用
- 問題が発生した場合やサポートが必要な場合は、SlackまたはDiscordのチャンネルに参加してください。
- pygwalkerを以下のソーシャルメディアプラットフォームで共有してください: