使用 pandas 索引和選擇數據

| | | | | | | | |

我們來看一個 Pandas 中的索引示例。在本文中我們使用“nba.csv ," 文件上傳 CSV,點擊 這裡 .

多行多列選擇

讓我們用一些假數據的 DataFrame,現在我們正在索引它DataFrame。在此,我們從DataFrame中選擇多行多列。帶有數據集的數據框。

假設我們只想選擇 Age College Salary 列對於標記為 Amir Johnson Terry Rozier

我們的最後一個 DataFrame w看起來像這樣:

選擇多行和所有列

假設我們要選擇行 Amir Jhonson , Terry Rozier John Holland 以及數據框中的所有列。

我們的最後一個 DataFrame 將如下所示:

選擇一些列和所有行

假設我們想要選擇年齡、身高和工資列包含數據框中的所有行。

我們的最後一個 DataFrame 將如下所示:

< /figure>

索引 pandas 使用 [] , .loc [] , 。 iloc [] , Dataframe .loc [] : 這個函數用於標籤。
  • Dataframe.iloc [] : 這個函數用於位置或整數
  • Dataframe.ix [] : 此函數用於標籤和整數。
  • 它們統稱為索引器。這些是迄今為止最常見的數據索引方式。這四個函數可幫助您從 DataFrame 中獲取元素、行和列。

    使用 [] 索引運算符對 Dataframe 進行索引:< br>運算符索引用於引用對像後面的方括號。在 , index_col = "Name" )


    # 使用索引運算符提取列

    first = data [ "年齡" ]



    print (first)

    退出:

    選擇多個列

    要選擇多個列,我們必須在索引語句中傳遞一個列列表.


    # import pandas package

    import pan das as pd


    # 從 CSV 文件創建數據框

    數據 = pd.read_csv ( "nba.csv" , index_col = "名稱" )


    # 使用索引運算符獲取多列

    first = data [[ "年齡" , "大學" , "Salary" ]]




    first

    退出:

    使用 , index_col = "名稱" )


    # 使用 loc 方法提取字符串讀取

    first = <代碼類s = "plain"> 數據 .loc [ "Avery Bradley" ]

    second = data.loc [ "RJ Hunter" ]



    print (第一, "" ,第二)

    輸出:
    如輸出圖像所示,返回兩個系列,因為兩次都只有一個參數。


    多行

    要選擇多行,我們將所有行標籤放在一個列表中,並將它們傳遞給函數。 loc .


    import pandas as pd


    # 從 CSV 文件創建數據框

    data = pd.read_csv ( "nba.csv" , index_col = "Name" )


    # 使用 loc 方法獲取多行

    first = data.loc [[ "Avery Bradley" , "RJ Hunter" ]]

    print (第一)

    < /tr>

    輸出:

    選擇兩行三列

    要選擇兩行三列,我們選擇兩行我們要選擇三列並將其放在一個單獨的列表中,如下所示:


     Dataframe.loc [["row1", "row2"], ["column1", "column2", "column3"] ] 

    import pandas as pd


    # 從 CSV 文件創建數據框

    data = pd.read_csv ( "nba.csv" <代碼類=“普通”>,index_col <代碼類=“關鍵字”>= "Name" )


    # 提取兩行三列使用loc方法

    first = data.loc [[ "Avery Bradley" , "RJ獵人" ] ,

    [ "團隊" , "Number" , "位置" ]]



    print (first)

    輸出:


    選擇所有行和一些列

    選擇所有行和一些列,我們使用單個冒號 [:], 來選擇所有行和我們要選擇的一些列的列表,如下所示:

     Dataframe.loc [[: , ["column1", "column2", "column3"]] 

    < tbody>

    import pandas as pd


    # 從 CSV 文件創建數據框

    data = pd.read_csv ( "nba.csv" , index_col = "Name" )


    <代碼 c lass = "comments "> # 使用 loc 方法獲取所有行和一些列

    first = data.loc [:, [ "團隊" , "數字" , "位置" ]]



    print (首先)

    退出:

    Indexing DataFrame using 。 iloc [] :
    這個函數可以讓我們按位置獲取行和列。為此,我們需要指定我們需要的行的位置,以及我們需要的列的位置。 df.iloc df.loc 非常相似,但只使用整數位置進行選擇。

    單行selection

    要使用.iloc [] 選擇一行,我們可以將一個整數傳遞給.iloc []

    import pandas as pd


    # 從 CSV 文件創建數據框

    data = pd.read_csv ( "nba.csv" , index_col = "名稱" )



    # iloc 提取行

    row2 = data.iloc [ 3 ]




    打印 (row2)

    退出:


    , index_col = "Name" )



    # 使用 iloc 方法獲取多行

    row2 = data.iloc [[ 3 , 5 , 7 ]]




    row2

    退出:


    選擇兩行兩列

    要選擇兩行兩列,我們為字符串創建一個包含 2 個整數的列表,為列創建一個包含 2 個整數的列表,然後傳遞函數 .iloc []


    import pandas as pd


    # 創建數據框CSV 文件

    數據 = pd.read_csv ( "nba.csv" , index_col = "Name" )



    # 提取使用 iloc 方法的兩行兩列

    row2 = data.iloc [[[ 3 , 4 ], [ 1 , 2 ]]

    print (row2)

    退出:

    選擇所有行和一些列

    選擇所有行和一些列,我們使用一個冒號 [:], 來選擇所有行,然後 fo r 列,我們組成一個整數列表,然後傳遞函數 .iloc [] .



    import pandas as pd


    # 從 CSV 文件創建數據框

    data = pd.read_csv ( "nba.csv" , index_col = "名稱" )



    # 使用 iloc 方法提取所有行和部分列

    row2 = data.iloc [:, [ 1 , 2 ]]

    print (row2)

    退出:

    索引使用 .ix [] as .loc []

    要選擇一行,我們在函數中放置一個單行標籤。ix 。這個函數的作用類似於.loc [] 如果我們將行標籤作為參數傳遞給函數。


    # import pandas package

    import pandas as pd


    # 從 CSV 文件創建數據框

    數據 = pd.read_csv ( "nba.csv" , index_col = "名稱" )


    # 使用 ix 方法獲取字符串

    first = data.ix [ "Avery Bradley" ]




    print (first)

    退出:

    使用 .ix [] as , index_col = "名稱" )


    # 使用 ix 方法獲取字符串

    first = data.ix [ 1 <代碼類="plain ">]


    print (第一)

    退出:

    <圖類 = aligncenter amp-wp-inline-71b6f2deb98f54bf23d07f2b79530929>


    DataFrame 中的索引方法

    < /tr>
    函數 說明
    Dataframe.head () 返回數據幀的前 n 行。
    Dataframe.tail () 返回數據幀的底部 n 行。
    Dataframe.at [] 訪問行/列標籤對的單個值。
    Dataframe.iat [] 按整數位置訪問行/列對的單個值。
    Dataframe.tail () 純粹基於整數位置的索引,用於按位置進行選擇。
    DataFrame.lookup() DataFrame 的基於標籤的“花式索引”功能。
    DataFrame .pop () 返回項目並從框架中刪除。
    DataFrame.xs() 從 DataFrame 返回橫截面(行或列)。
    DataFrame.get() 從對像中獲取給定鍵的項目(DataFrame 列、面板切片等)。
    DataFrame.isin() 返回布爾數據框顯示是否中的每個元素DataFrame 包含在值中。
    DataFrame.where () 返回一個與 self 形狀相同的對象,其對應的條目來自 self ,其中 cond 為 True ,否則來自其他。< /td>

    Shop

    Learn programming in R: courses

    $

    Best Python online courses for 2022

    $

    Best laptop for Fortnite

    $

    Best laptop for Excel

    $

    Best laptop for Solidworks

    $

    Best laptop for Roblox

    $

    Best computer for crypto mining

    $

    Best laptop for Sims 4

    $

    Latest questions

    NUMPYNUMPY

    psycopg2: insert multiple rows with one query

    12 answers

    NUMPYNUMPY

    How to convert Nonetype to int or string?

    12 answers

    NUMPYNUMPY

    How to specify multiple return types using type-hints

    12 answers

    NUMPYNUMPY

    Javascript Error: IPython is not defined in JupyterLab

    12 answers


    Wiki

    Python OpenCV | cv2.putText () method

    numpy.arctan2 () in Python

    Python | os.path.realpath () method

    Python OpenCV | cv2.circle () method

    Python OpenCV cv2.cvtColor () method

    Python - Move item to the end of the list

    time.perf_counter () function in Python

    Check if one list is a subset of another in Python

    Python os.path.join () method