Indeksowanie i wybieranie danych za pomocą pand

| | | | | | | | |

Rzućmy okiem na przykład indeksowania w Pandas. W tym artykule używamy pliku „nba.csv ”, aby przesłać CSV, kliknij tutaj .

Wybór wielu wierszy i wielu kolumn

Weźmy DataFrame z fałszywymi danymi, teraz je indeksujemy DataFrame. W tym celu wybieramy wiele wierszy i wiele kolumn z DataFrame. Ramka danych z zestawem danych.

Załóżmy, że chcemy wybrać tylko kolumny Wiek , Uczelnia i Wynagrodzenie dla wierszy oznaczonych Amir Johnson i Terry Rozier

Nasza ostatnia ramka DataFrame w źle wygląda tak:

Wybierz wiele wierszy i wszystkie kolumny

Powiedzmy, że chcemy wybrać wiersz Amir Jhonson , Terry Rozier i John Holland ze wszystkimi kolumnami w ramce danych .

Nasza ostatnia ramka DataFrame będzie wyglądać tak:

Zaznaczanie niektórych kolumn i wszystkich wierszy

Powiedzmy, że chcemy wybierz kolumny Wiek, Wzrost i Wynagrodzenie ze wszystkimi wierszami w ramce danych.

Nasza ostatnia ramka DataFrame będzie wyglądać tak:

< /figure>

Indeksowanie pand za pomocą [] , .loc [] , . iloc [] , Dataframe .loc [] : ta funkcja jest używana do etykiet.
  • Dataframe.iloc [] : to funkcja jest używana dla pozycji lub liczb całkowitych
  • Dataframe.ix [] : ta funkcja jest używana zarówno dla etykiet, jak i liczb całkowitych.
  • Łącznie nazywa się je indeksatorami . Są to zdecydowanie najczęstsze sposoby indeksowania danych. Są to cztery funkcje, które pomagają uzyskać elementy, wiersze i kolumny z DataFrame.

    Indeksowanie Dataframe za pomocą operatora indeksowania [] : < br>Indeksowanie operatorów jest używane w odniesieniu do nawiasów kwadratowych znajdujących się za obiektem. W , index_col = "Nazwa" )


    # wyodrębnianie kolumn za pomocą operatora indeksu

    pierwszy = dane [ "Wiek" ]



    print (pierwszy)

    Wyjście:

    Wybieranie wielu kolumn

    Aby wybrać wiele kolumn, musimy przekazać listę kolumn w instrukcji indeksowania .


    # importuj pakiet pandy

    importuj pa n das as pd


    # utwórz ramkę danych z pliku CSV

    data = pd.read_csv ( "nba.csv" , index_col = " Name " )


    # pobierz wiele kolumn za pomocą operatora indeksu

    pierwszy = dane [[ "Wiek" , "College" , "Salary" ]]




    pierwszy

    Wyjście:

    Indeksowanie ramki DataFrame przy użyciu , index_col = "Nazwa" )


    # wyodrębnij odczytywanie ciągów za pomocą metody loc

    first = < /kod> data .loc [ "Avery Bradley" ]

    drugi = data.loc [ "RJ Hunter" ]



    print (pierwszy, "" , drugi)

    Dane wyjściowe:
    Jak pokazano na obrazie wyjściowym, zostały zwrócone dwie serie, ponieważ za każdym razem był tylko jeden parametr.


    Aby wybrać wiele wierszy, umieszczamy wszystkie etykiety wierszy na liście i przekazujemy je do funkcji . loc .


    importuj pandy jako pd


    # utwórz ramkę danych z pliku CSV

    dane = pd.read_csv ( "nba.csv" , index_col = "Name" )


    # uzyskaj wiele wierszy za pomocą metody loc

    najpierw = data.loc [[ "Avery Bradley" , " RJ Hunter ” ]]

    print (pierwszy)

    < /tr>

    Dane wyjściowe:

    Wybieranie dwóch wierszy i trzech kolumn

    Aby wybrać dwa wiersze i trzy kolumny, wybieramy dwa wiersze chcemy wybrać i trzy kolumny i umieścić je na osobnej liście w następujący sposób:


     Dataframe.loc [["wiersz1", "wiersz2"], ["kolumna1", "kolumna2", "column3"]] 

    importuj pandy jako pd


    # utwórz ramkę danych z pliku CSV

    dane = pd.read_csv ( "nba.csv" , index_col = "Name" )


    # ekstrakcji dwa wiersze i trzy kolumny przy użyciu metody loc

    first = data.loc [[ "Avery Bradley" , "RJ Hunter" ] ,

    [ "Zespół" , "Number" , "Pozycja" ]]



    print (pierwszy)

    Dane wyjściowe:


    Zaznaczanie wszystkich wierszy i niektórych kolumn

    Aby zaznaczyć wszystkie wiersze i niektóre kolumn, używamy pojedynczego dwukropka [:], do zaznaczenia wszystkich wierszy i listy niektórych kolumn, które chcemy wybrać w następujący sposób:

     Dataframe.loc [[: , ["kolumna1", "kolumna2", "kolumna3"]] 

    < tbody>

    importuj pandy jako pd


    # utwórz ramkę danych z pliku CSV

    data = pd.read_csv ( "nba.csv" , index_col = "Name" )


    # pobierz wszystkie wiersze i niektóre kolumny przy użyciu metody loc

    first = data.loc [:, [ "Zespół" , "Number" , "Pozycja" ]]



    print ( najpierw)

    Wyjście:

    Indeksowanie DataFrame za pomocą . iloc [] :
    Ta funkcja pozwala nam uzyskać wiersze i kolumny według pozycji. Aby to zrobić, musimy określić pozycje potrzebnych nam wierszy, a także pozycje potrzebnych nam kolumn. df.iloc jest bardzo podobny do df.loc , ale do wyboru używa tylko lokalizacji liczb całkowitych.

    Pojedyncza linia wybór

    Aby wybrać jedną linię za pomocą .iloc [] , możemy przekazać jedną liczbę całkowitą do .iloc [] .

    importuj pandy jako pd


    # utwórz ramkę danych z pliku CSV

    dane = pd.read_csv ( "nba.csv" , index_col = "Nazwa" )



    # iloc ekstrakcji wierszy

    row2 = data.iloc [ 3 ]




    print (row2)

    Wyjście:


    , index_col = "Name" )



    # pobieranie wielu wierszy metodą iloc

    row2 = data.iloc [[ 3 , 5 , 7 ]]




    row2

    Wyjście:


    Wybieranie dwóch wierszy i dwóch kolumn

    Aby wybrać dwa wiersze i dwie kolumny, tworzymy listę 2 liczb całkowitych dla łańcuchów i listę 2 liczb całkowitych dla kolumn, a następnie przekazujemy funkcję .iloc [] .


    importuj pandy jako pd


    # utwórz ramkę danych z plik CSV

    dane = pd.read_csv ( "nba.csv" , index_col = "Name" )



    # ekstrakcji dwóch wierszy i dwóch kolumn przy użyciu metody iloc

    row2 = data.iloc [[[ 3 , 4 ], [ 1 , 2 ]]

    print (row2)

    Wyjście:

    Zaznacz wszystkie wiersze i niektóre kolumny

    Aby zaznaczyć wszystkie wiersze i w niektórych kolumnach używamy pojedynczego dwukropka [:], do zaznaczenia wszystkich wierszy i fo r kolumn, tworzymy listę liczb całkowitych, a następnie przekazujemy funkcję .iloc [] .



    importuj pandy jako pd


    # utwórz ramkę danych z pliku CSV

    dane = pd.read_csv ( "nba.csv" , index_col = "Nazwa" )



    # wyodrębnianie wszystkich wierszy i niektórych kolumn metodą iloc

    row2 = data.iloc [:, [ 1 , 2 ]]

    print (row2)

    Wyjście:

    Indeksowanie przy użyciu ramki danych .ix [] jako .loc []

    Aby wybrać jeden wiersz, umieszczamy etykietę pojedynczego wiersza w funkcji .ix . Ta funkcja działa jak .loc [] jeśli przekażemy etykietę linii jako argument do funkcji.


    # importuj pakiet pandy

    importuj pandy jako pd


    # utwórz ramkę danych z pliku CSV

    dane = pd.read_csv ( " nba.csv " , index_col = "Name" )


    # pobieranie ciągu za pomocą metody ix

    first = data.ix [ "Avery Bradley" ]




    print (pierwszy)

    Wyjście:

    Wybór jednej linii za pomocą .ix [] as , index_col = "Name" )


    # pobieranie ciągu za pomocą metody ix

    pierwszy = data.ix [ 1 ]


    print (pierwszy)

    Wyjście:

    < figure class = aligncenter amp-wp-inline-71b6f2deb98f54bf23d07f2b79530929>


    Metody indeksowania w DataFrame

    Opis

    < /tr>
    Funkcja
    Dataframe.head () Zwróć n wierszy na górę ramki danych.
    Dataframe.tail () Zwróć dolne n wierszy ramki danych.
    Dataframe.at [] Dostęp do pojedynczej wartości dla pary etykiet wiersz/kolumna.
    Dataframe.iat [] Dostęp do pojedynczej wartości dla pary wiersz/kolumna według pozycji liczby całkowitej .
    Dataframe.tail () Indeksowanie oparte wyłącznie na liczbach całkowitych do wyboru według pozycji.
    DataFrame.lookup () Oparta na etykietach funkcja „fantazyjnego indeksowania” dla DataFrame.
    DataFrame .pop () Zwróć element i upuść z ramki.
    DataFrame.xs() Zwraca przekrój (wiersze lub kolumny) z elementu DataFrame.
    DataFrame.get () Pobierz element z obiektu dla danego klucza (kolumna DataFrame, wycinek panelu itp.).
    DataFrame.isin () Zwraca wartość logiczną DataFrame pokazującą, czy każdy element w DataFrame jest zawarta w wartościach.
    DataFrame.where () Zwraca obiekt o takim samym kształcie jak self i którego odpowiednie wpisy pochodzą od self, gdzie cond jest prawdą, a w przeciwnym razie pochodzą z other.< /td>

    Shop

    Learn programming in R: courses

    $

    Best Python online courses for 2022

    $

    Best laptop for Fortnite

    $

    Best laptop for Excel

    $

    Best laptop for Solidworks

    $

    Best laptop for Roblox

    $

    Best computer for crypto mining

    $

    Best laptop for Sims 4

    $

    Latest questions

    NUMPYNUMPY

    psycopg2: insert multiple rows with one query

    12 answers

    NUMPYNUMPY

    How to convert Nonetype to int or string?

    12 answers

    NUMPYNUMPY

    How to specify multiple return types using type-hints

    12 answers

    NUMPYNUMPY

    Javascript Error: IPython is not defined in JupyterLab

    12 answers


    Wiki

    Python OpenCV | cv2.putText () method

    numpy.arctan2 () in Python

    Python | os.path.realpath () method

    Python OpenCV | cv2.circle () method

    Python OpenCV cv2.cvtColor () method

    Python - Move item to the end of the list

    time.perf_counter () function in Python

    Check if one list is a subset of another in Python

    Python os.path.join () method