Groupby—非常にシンプルなコンセプト。カテゴリのグループを作成し、その関数をカテゴリに適用できます。これは単純な概念ですが、
- 分離:は、データセットにいくつかの条件を適用することにより、データをグループに分割するプロセスです。 。
- アプリケーション:は、各グループに個別に機能を適用するプロセスです。
- 統合:は、次のプロセスです。グループ化と結果をデータ構造に適用した後、さまざまなデータセットを組み合わせます。
次の画像は、Groupbyの概念に関連するプロセスを理解するのに役立ちます。
1。 「チーム」列から一意の値をグループ化します。
2。これで、各グループにバケットができました
3。他のデータをバケットにスローします
4。各バケットの重み列に関数を適用します。
データをグループに分割する
分割—これは、データセットにいくつかの条件を適用することにより、データをグループに分割するプロセスです。データを分離するために、データセットに特定の条件を適用します。データを分離するには、 groupby ()
を使用します。この関数は、いくつかの基準に従ってデータをグループに分割するために使用されます。 。 Pandasオブジェクトは、任意の軸に細分化できます。グループ化の抽象的な定義は、ラベルからグループ名へのマッピングを提供することです。パンダのデータセットは、任意のオブジェクトに分割できます。データを分割する方法はいくつかあります。たとえば、次のようになります。
- obj。
groupby (キー) - obj。
groupby (key、axis = 1) - obj。 groupby ([key1、key2])
注:ここにオブジェクトのグループ化をキーと呼びます。
1つのキーでデータをグループ化する:
1つのキーでデータをグループ化するには、
関数。
< br>
出力: これで、形成されたすべてのグループの最初のレコードが出力されます。
出力: 複数のキーを使用したデータのグループ化:
|
出力: キーの並べ替えによるデータのグループ化:
出力: |
出力: オブジェクト属性を使用したデータのグループ化:
<コードクラス="コメント" >#グループ化キーを使用
出力: グループの反復Toグループアイテムを反復処理すると、iterto.olsのようなオブジェクトを反復処理できます。
出力:
出力: グループの選択を選択するにはグループの場合、
出力: Group selectionグループを選択するには、 |