Skip to content

Latest commit

 

History

History
200 lines (144 loc) · 12.9 KB

README.ja.md

File metadata and controls

200 lines (144 loc) · 12.9 KB

現在の言語のネイティブスピーカーであれば、このドキュメントの翻訳を維持するためにご協力いただけると幸いです。PRはこちらから行うことができます。

PyGWalker:データ探索と可視化のためのPythonライブラリ

PyPI version binder PyPI downloads conda-forge

discord invitation link Twitter Follow Join Kanaries on Slack

PyGWalkerは、pandasデータフレーム(およびpolarsデータフレーム)を使用して、Jupyter Notebookのデータ分析およびデータ可視化ワークフローを簡素化し、Tableauスタイルのユーザーインターフェースに変換することで、視覚的な探索を可能にします。

PyGWalker("Pig Walker"のように発音、楽しみのために)は、「Python binding of Graphic Walker」の略称として命名されています。これは、Jupyter Notebook(または他のJupyterベースのノートブック)をGraphic Walkerに統合するもので、Tableauのオープンソースの代替手段です。これにより、データサイエンティストは、シンプルなドラッグアンドドロップ操作でデータを分析し、パターンを可視化できます。

Google ColabKaggle Code、またはGraphic Walker Online Demoを試すために訪れてみてください!

Rを使用する場合は、GWalkRをチェックしてみてください!

スタートガイド

Kaggleで実行 Colabで実行
Kaggleコード Google Colab

pygwalkerのセットアップ

pygwalkerを使用する前に、コマンドラインを使用してpipまたはcondaを介してパッケージをインストールしてください。

pip

pip install pygwalker

注意

早期の試用版の場合、pip install pygwalker --upgradeを使用してバージョンを最新に保つか、さらにpip install pygwaler --upgrade --preを使用して最新の機能とバグ修正を取得できます。

Conda-forge

conda install -c conda-forge pygwalker

または

mamba install -c conda-forge pygwalker

詳細なヘルプについては、conda-forge feedstockを参照してください。

Jupyter Notebookでpygwalkerを使用する

クイックスタート

pygwalkerとpandasをJupyter Notebookにインポートして開始します。

import pandas as pd
import pygwalker as pyg

既存のワークフローを壊すことなくpygwalkerを使用できます。たとえば、次のようにデータフレームを読み込んでGraphic Walkerを呼び出すことができます。

df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(df)

より良いプラクティス

df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(
    df,
    spec="./chart_meta_0.json",    # このJSONファイルにはチャートの状態が保存されます。チャートが完了したらUIで保存ボタンをクリックする必要があります。将来的には「自動保存」がサポートされる予定です。
    kernel_computation=True,          # `kernel_computation=True`を設定すると、pygwalkerは計算エンジンとしてduckdbを使用します。これにより、より大きなデータセット(<=100GB)を探索できます。
)

オフライン例

オンライン例


以上です。これで、ドラッグアンドドロップの変数を使用してデータを分析および可視化するTableauのようなユーザ

ーインターフェースが利用可能です。

Graphic Walkerでできる素晴らしいこと:

  • マークタイプを他のものに変更して異なるチャートを作成できます。たとえば、ラインチャート: graphic walker line chart

  • 異なる測定値を比較するために、複数の測定値を行または列に追加して連結ビューを作成できます。 graphic walker area chart

  • 次元の値によって分割されたいくつかのサブビューを持つファセットビューを作成するには、次元を行または列に追加してファセットビューを作成します。ルールはTableauと似ています。 graphic walker scatter chart

  • テーブルでデータフレームを表示し、分析タイプとセマンティックタイプを設定できます。 page-data-view-light

  • データ探索結果をローカルファイルに保存できます

詳細な手順については、Graphic Walker GitHubページを参照してください。

テストされた環境

  • Jupyter Notebook
  • Google Colab
  • Kaggle Code
  • Jupyter Lab(作業中:いくつかの小さなCSSの問題がまだあります)
  • Jupyter Lite
  • Databricks Notebook(バージョン0.1.4a0以降)
  • Visual Studio Code用Jupyter拡張機能(バージョン0.1.4a0以降)
  • Hex Projects(バージョン0.1.4a0以降)
  • IPythonカーネルと互換性のあるほとんどのWebアプリケーション(バージョン0.1.4a0以降)
  • Streamlit(バージョン0.1.4.9以降)pyg.walk(df, env='Streamlit')を有効にしました
  • DataCamp Workspace(バージョン0.1.4a0以降)
  • ... 他の環境についての要望があれば、遠慮なく問題を提起してください。

構成とプライバシーポリシー(pygwlaker >= 0.3.10)

$ pygwalker config --help

usage: pygwalker config [-h] [--set [key=value ...]] [--reset [key ...]] [--reset-all] [--list]

Modify configuration file. (default: /Users/douding/Library/Application Support/pygwalker/config.json) 
Available configurations:

- privacy  ['offline', 'update-only', 'events'] (default: events).
    "offline": fully offline, no data is send or api is requested
    "update-only": only check whether this is a new version of pygwalker to update
    "events": share which events about which feature is used in pygwalker, it only contains events data about which feature you arrive for product optimization. No DATA YOU ANALYSIS IS SEND.
    
- kanaries_token  ['your kanaries token'] (default: empty string).
    your kanaries token, you can get it from https://kanaries.net.
    refer: https://space.kanaries.net/t/how-to-get-api-key-of-kanaries.
    by kanaries token, you can use kanaries service in pygwalker, such as share chart, share config.
    

options:
  -h, --help            show this help message and exit
  --set [key=value ...]
                        Set configuration. e.g. "pygwalker config --set privacy=update-only"
  --reset [key ...]     Reset user configuration and use default values instead. e.g. "pygwalker config --reset privacy"
  --reset-all           Reset all user configuration and use default values instead. e.g. "pygwalker config --reset-all"
  --list                List current used configuration.

詳細は参照してください: How to set your privacy configuration?

ライセンス

Apache License 2.0

リソース

Reddit HackerNews Twitter Facebook LinkedIn