パンダを使用したデータのインデックス作成と選択

| | | | | | | | |

パンダでのインデックス作成の例を見てみましょう。この記事では、「 nba.csv 、"ファイルを使用してCSVをアップロードし、ここ。

複数行と複数列の選択

偽のデータを含むDataFrameを取得しましょう。これで、インデックスを作成します。 DataFrame。ここでは、DataFrameから複数の行と複数の列を選択します。データセットを含むデータフレーム。

Age College Salaryの列のみを選択するとします。 Amir JohnsonおよびTerryRozier

最後のDataFramew病気は次のようになります:

複数の行とすべての列を選択します

行を選択するとしますAmirJhonson Terry Rozier およびJohnHollandとデータフレーム内のすべての列。

最後のDataFrameは次のようになります:

いくつかの列とすべての行を選択する

年齢、身長、給与の列を選択しますデータフレーム内のすべての行を使用します。

最後のDataFrameは次のようになります:

< / figure>

[] を使用したパンダのインデックス作成.loc [] 。 iloc [] Dataframe .loc [] :この関数はラベルに使用されます。
  • Dataframe.iloc [] this関数は位置または整数に使用されます
  • Dataframe.ix [] この関数は、ラベルと整数の両方に使用されます。
  • まとめてインデクサーと呼ばれます。これらは、データにインデックスを付ける最も一般的な方法です。これらは、DataFrameから要素、行、および列を取得するのに役立つ4つの関数です。

    [] インデックス演算子を使用したデータフレームのインデックス作成: < br>演算子のインデックスは、オブジェクトに続く角括弧を参照するために使用されます。 、index_col = "名前"


    #インデックス演算子を使用して列を抽出します

    最初の = データ[ "Age" ]



    print (最初)

    終了:

    複数の列を選択する

    複数の列を選択するには、インデックスステートメントで列のリストを渡す必要があります。


    #パンダパッケージをインポート

    import pa n das as pd


    #CSVファイルからデータフレームを作成

    データ = pd.read_csv( "nba.csv" 、index_col = "名前"


    #インデックス演算子を使用して複数の列をフェッチします

    最初 = data [[ "Age" "College" "Salary" ]]




    最初の

    終了:

    、index_col = "Name"


    #locメソッドを使用して文字列の読み取り値を抽出

    最初 = <コードクラスs = "plain"> data .loc [ "Avery Bradley" ]

    second = data.loc [ "RJ Hunter" ]



    print (最初、 "" 、2番目)

    出力:
    出力画像に示されているように、両方の時間にパラメーターが1つしかないため、2つのシリーズが返されました。


    複数行を選択するには、すべての行ラベルをリストに入れて、関数。 loc


    import pandas as pd


    #CSVファイルからデータフレームを作成

    データ = pd.read_csv( "nba.csv" 、index_col = "Name"


    #locメソッドを使用して複数行を取得

    最初 = data.loc [[ "Avery Bradley" "RJ Hunter" ]]

    印刷(最初)

    < / tr>

    出力:

    2行3列の選択

    2行3列を選択するには、2行を選択します。 3つの列を選択して、次のように別のリストに配置します。


     Dataframe.loc [["row1"、 "row2"]、["column1"、 "column2"、 "column3"]] 

    import pandas as pd


    #CSVファイルからデータフレームを作成

    data = pd.read_csv( "nba.csv" 、index_col = "Name"


    #抽出locメソッドを使用した2行3列

    最初の = data.loc [[ "Avery Bradley" "RJハンター" ]、

    [ "チーム" "Number" "Position" ]]



    print (最初)

    < / p>

    出力:


    すべての行と一部の列を選択する

    すべての行と一部を選択するには列の場合、単一のコロン [:]、を使用して、すべての行と、選択する列の一部のリストを次のように選択します。

     Dataframe.loc [[: 、["column1"、 "column2"、 "column3"]] 

    < tbody>

    import pandas as pd


    #CSVファイルからデータフレームを作成

    データ = pd.read_csv( "nba.csv" 、index_col = "Name"


    <コードc lass = "comments">#locメソッドを使用してすべての行と一部の列をフェッチします

    最初の = data.loc [:、[ "チーム" "Number" "Position" ]]



    印刷(最初)

    終了: < / p>

    <コード>。 iloc [] :
    この関数を使用すると、位置ごとに行と列を取得できます。これを行うには、必要な行の位置と、必要な列の位置を指定する必要があります。 df.ilocdf.locと非常によく似ていますが、選択に整数の位置のみを使用します。

    1行選択

    .iloc [] を使用して1行を選択するには、1つの整数を .iloc []に渡すことができます。

    import pandas as pd


    #CSVファイルからデータフレームを作成

    データ = pd.read_csv( "nba.csv" 、index_col = "名前"



    #行のiloc抽出

    row2 = data.iloc [ 3 ]




    印刷(row2)

    終了:


    、index_col = "Name"



    #ilocメソッドを使用して複数行を取得

    row2 = data.iloc [[ 3 5 7 ]]




    row2

    終了:


    2行2列の選択

    2行2列を選択するには、文字列用に2つの整数のリストを作成し、列用に2つの整数のリストを作成してから、関数 .iloc []を渡します。


    import pandas as pd


    #からデータフレームを作成CSVファイル

    データ = pd.read_csv ( "nba.csv" 、index_col = "Name"



    #抽出ilocメソッドを使用した2行2列のデータ

    row2 = data.iloc [[[ 3 4 ]、[ 1 2 ]]

    print (row2)

    終了:

    すべての行と一部の列を選択

    すべての行と一部の列では、単一のコロン [:]、を使用してすべての行を選択し、fo r列の場合、整数のリストを作成してから、関数 .iloc []を渡します。



    import pandas as pd


    #CSVファイルからデータフレームを作成

    データ = pd.read_csv( "nba.csv" 、index_col = "名前"



    #ilocメソッドを使用したすべての行と一部の列の抽出

    row2 = data.iloc [:、[ 1 2 ]]

    print (row2)

    終了:

    データフレームを使用したインデックス作成。 ix [] :
    パンダの開発の初期には、別のインデクサー ixがありました。このインデクサーは、ラベルと場所全体の両方で選択できます。これは普遍的でしたが、明示的ではないため、多くの混乱を引き起こしました。整数は、行または列のラベルになることもあります。このように、これが曖昧な場合があります。通常、 ix タグに基づいており、 .locのインデクサーとして機能します。ただし、 .ix は、整数が渡される整数型(.ilocなど)の選択もサポートしています。これは、DataFrameのインデックスが整数ベースではない場合にのみ機能します。 .ixは入力.locおよび.ilocのいずれかを受け入れます。
    注。 インデックス.ixは、最近のバージョンのPandasでは廃止されました。

    .ix [] as 。loc[]

    1つの行を選択するには、function。ixに1つの行ラベルを配置します。この関数は.locのように機能します。 []関数の引数として行ラベルを渡す場合。


    #パンダパッケージをインポート

    import pandas as pd


    #CSVファイルからデータフレームを作成

    data = pd.read_csv( "nba.csv " 、index_col = "名前"


    #ixメソッドを使用して文字列を取得する

    最初 = data.ix [ "エイブリーブラッドリー" ]




    印刷 (最初)

    終了:

    。ix[] as 、index_col = "名前"


    #ixメソッドを使用して文字列を取得する

    最初の = data.ix [ 1 ]


    print (最初)

    終了:

    < figure class = aligncenter amp-wp-inline-71b6f2deb98f54bf23d07f2b79530929>

    DataFrameのインデックス作成メソッド

    < / tr>
    関数説明
    Dataframe.head() データフレームの一番上のn行を返します。
    Dataframe.tail() データフレームの下のn行を返します。
    Dataframe.at [] 行と列のラベルペアの単一の値にアクセスします。
    Dataframe.iat [] 整数位置で行/列ペアの単一の値にアクセスします。
    Dataframe.tail() 位置による選択のための純粋な整数位置ベースのインデックス。
    DataFrame.lookup() ラベルベースの「データフレーム用のファンシーインデックス」関数。
    DataFrame .pop() アイテムを返し、フレームからドロップします。
    DataFrame.xs() DataFrameから断面(行または列)を返します。
    DataFrame.get() 指定されたキー(DataFrame列、パネルスライスなど)のオブジェクトからアイテムを取得します。
    DataFrame.isin() ブール値のDataFrameを返します。の各要素DataFrameは値に含まれています。
    DataFrame.where() selfと同じ形状のオブジェクトを返し、対応するエントリはselfからのものであり、condはTrueであり、それ以外の場合は他からのものです。< / td>

    Shop

    Learn programming in R: courses

    $

    Best Python online courses for 2022

    $

    Best laptop for Fortnite

    $

    Best laptop for Excel

    $

    Best laptop for Solidworks

    $

    Best laptop for Roblox

    $

    Best computer for crypto mining

    $

    Best laptop for Sims 4

    $

    Latest questions

    NUMPYNUMPY

    psycopg2: insert multiple rows with one query

    12 answers

    NUMPYNUMPY

    How to convert Nonetype to int or string?

    12 answers

    NUMPYNUMPY

    How to specify multiple return types using type-hints

    12 answers

    NUMPYNUMPY

    Javascript Error: IPython is not defined in JupyterLab

    12 answers


    Wiki

    Python OpenCV | cv2.putText () method

    numpy.arctan2 () in Python

    Python | os.path.realpath () method

    Python OpenCV | cv2.circle () method

    Python OpenCV cv2.cvtColor () method

    Python - Move item to the end of the list

    time.perf_counter () function in Python

    Check if one list is a subset of another in Python

    Python os.path.join () method