Indicizzazione e selezione dei dati con i panda

| | | | | | | | |

Diamo un`occhiata a un esempio di indicizzazione in Pandas. In questo articolo utilizziamo il file "nba.csv ‚" per caricare CSV, fare clic su qui .

Selezione di più righe e più colonne

Prendiamo un DataFrame con alcuni dati falsi, ora lo stiamo indicizzando DataFrame. In questo, selezioniamo più righe e più colonne da DataFrame. Data frame con set di dati.

Supponiamo di voler selezionare solo le colonne Età , Università e Stipendio per le righe etichettate Amir Johnson e Terry Rozier

Il nostro ultimo DataFrame w ill aspetto così:

Seleziona più righe e tutte le colonne

Diciamo di voler selezionare la riga Amir Jhonson , Terry Rozier e John Holland con tutte le colonne nel dataframe .

Il nostro ultimo DataFrame sarà simile a questo:

Selezione di alcune colonne e di tutte le righe

Diciamo di voler seleziona le colonne Età, Altezza e Stipendio con tutte le righe nel dataframe.

Il nostro ultimo DataFrame sarà simile al seguente:

< /figure>

Indicizzazione dei panda usando [] , .loc [] , . iloc [] , Dataframe .loc [] : questa funzione viene utilizzata per le etichette.
  • Dataframe.iloc [] : questo viene utilizzata per posizioni o numeri interi
  • Dataframe.ix [] : questa funzione viene utilizzata sia per le etichette che per i numeri interi.
  • Collettivamente sono chiamati indicizzatori . Questi sono di gran lunga i modi più comuni per indicizzare i dati. Queste sono quattro funzioni che ti aiutano a ottenere elementi, righe e colonne da un DataFrame.

    Indicizzazione di un Dataframe usando l`operatore di indicizzazione [] : < br>L`indicizzazione dell`operatore viene utilizzata per fare riferimento a parentesi quadre che seguono un oggetto. In , index_col = "Nome" )


    # estrazione di colonne utilizzando l`operatore indice

    first = data [ "Età" ]



    print (prima)

    Esci:

    Selezione di più colonne

    Per selezionare più colonne, dobbiamo passare un elenco di colonne nell`istruzione di indicizzazione .


    # import pacchetto pandas

    import pa n das as pd


    # crea frame di dati dal file CSV

    data = pd.read_csv ( "nba.csv" , index_col = " Nome " )


    # recupera più colonne utilizzando l`operatore di indice

    first = dati [[ "Età" , "College" , "Salario" ]]




    first

    Esci:

    Indicizzazione del DataFrame utilizzando , index_col = "Nome" )


    # estrae la lettura della stringa usando il metodo loc

    first = < /codice> data .loc [ "Avery Bradley" ]

    secondo = data.loc [ "RJ Hunter" ]



    print (primo, "" , secondo)

    Output:
    Come mostrato nell`immagine di output, sono state restituite due serie poiché entrambe le volte era presente un solo parametro.


    Selezione righe multiple

    Per selezionare più righe, inseriamo tutte le etichette di riga in un elenco e le passiamo alla funzione . loc .


    import panda come pd


    # crea frame di dati da file CSV

    data = pd.read_csv ( "nba.csv" , index_col = "Nome" )


    # ottieni più righe usando il metodo loc

    first = data.loc [[ "Avery Bradley" , " RJ Hunter " ]]

    print (prima)

    < /tr>

    Output:

    Selezione di due righe e tre colonne

    Per selezionare due righe e tre colonne, selezioniamo le due righe vogliamo selezionare e tre colonne e inserirle in un elenco separato come questo:


     Dataframe.loc [["row1", "row2"], ["column1", "column2", "column3"] ] 

    import panda come pd


    # crea frame di dati da file CSV

    data = pd.read_csv ( "nba.csv" < codice classe = "semplice">, index_col = "Nome" )


    # estrazione due righe e tre colonne usando il metodo loc

    first = data.loc [[ "Avery Bradley" , "RJ Hunter" ] ,

    [ "Team" , "Numero" , "Posizione" ]]



    print (prima)

    Output:


    Selezione di tutte le righe e di alcune colonne

    Per selezionare tutte le righe e alcune colonne, utilizziamo i due punti singoli [:], per selezionare tutte le righe e un elenco di alcune delle colonne che vogliamo selezionare come segue:

     Dataframe.loc [[: , ["colonna1", "colonna2", "colonna3"]] 

    < tbody>

    import panda come pd


    # crea frame di dati dal file CSV

    data = pd.read_csv ( "nba.csv" , index_col = "Nome" )


    # recupera tutte le righe e alcune colonne usando il metodo loc

    first = data.loc [:, [ "Team" , "Numero" , "Posizione" ]]



    print ( prima)

    Esci:

    Indicizzazione di DataFrame utilizzando . iloc [] :
    Questa funzione ci permette di ottenere righe e colonne per posizione. Per fare ciò, dobbiamo specificare le posizioni delle righe di cui abbiamo bisogno, così come le posizioni delle colonne di cui abbiamo bisogno. df.iloc è molto simile a df.loc ma utilizza solo posizioni intere per la selezione.

    Riga singola selezione

    Per selezionare una riga utilizzando .iloc [] , possiamo passare un intero a .iloc [] .

    import panda come pd


    # crea frame di dati da file CSV

    dati = pd.read_csv ( "nba.csv" , index_col = "Nome" )



    # iloc estrazione di righe

    riga2 = data.iloc [ 3 ]




    stampa (riga2)

    Esci:


    , index_col = "Nome" )



    # ottenere più righe usando il metodo iloc

    riga2 = data.iloc [[ 3 , 5 , 7 ]]




    row2

    Esci:


    Selezione di due righe e due colonne

    Per selezionare due righe e due colonne, creiamo una lista di 2 interi per le stringhe e una lista di 2 interi per le colonne, quindi passiamo la funzione .iloc [] .


    import panda come pd


    # crea frame di dati da File CSV

    data = pd.read_csv ( "nba.csv" , index_col = "Nome" )



    # estrazione di due righe e due colonne utilizzando il metodo iloc

    row2 = data.iloc [[[ 3 , 4 ], [ 1 , 2 ]]

    print (riga2)

    Esci:

    Seleziona tutte le righe e alcune colonne

    Per selezionare tutte le righe e alcune colonne, utilizziamo i due punti singoli [:], per selezionare tutte le righe e fo r colonne, componiamo un elenco di interi e quindi passiamo la funzione .iloc [] .



    import panda come pd


    # crea frame di dati da file CSV

    dati = pd.read_csv ( "nba.csv" , index_col = "Nome" )



    # estrazione di tutte le righe e di alcune colonne utilizzando il metodo iloc

    row2 = data.iloc [:, [ 1 , 2 ]]

    print (riga2)

    Esci:

    Indicizzazione utilizzando .ix [] come .loc []

    Per selezionare una riga, mettiamo un`etichetta di riga singola nella funzione .ix . Questa funzione si comporta come .loc [] se passiamo l`etichetta della riga come argomento alla funzione.


    # import pacchetto pandas

    import panda come pd


    # crea frame di dati da file CSV

    dati = pd.read_csv ( " nba.csv " , index_col = "Nome" )


    # ottenere una stringa usando il metodo ix

    first = data.ix [ "Avery Bradley" ]




    print (prima)

    Esci:

    Selezione di una riga utilizzando .ix [] come , index_col = "Nome" )


    # ottenere una stringa usando il metodo ix

    first = data.ix [ 1 ]


    print (prima)

    Esci:

    < figure class = aligncenter amp-wp-inline-71b6f2deb98f54bf23d07f2b79530929>


    Metodi di indicizzazione in DataFrame

    < /tr>
    Funzione Descrizione
    Dataframe.head () Ritorna le prime n righe di un frame di dati.
    Dataframe.tail () Restituisce le n righe inferiori di un frame di dati.
    Dataframe.at [] Accedi a un singolo valore per una coppia di etichette riga/colonna.
    Dataframe.iat [] Accedi a un valore singolo per una coppia riga/colonna in base alla posizione intera.
    Dataframe.tail () Indicizzazione basata esclusivamente su posizioni intere per la selezione per posizione.
    DataFrame.lookup() Funzione "indicizzazione fantasia‚" basata su etichette per DataFrame.
    DataFrame .pop () Ritorna l`elemento e rilascialo dal frame.
    DataFrame.xs() Restituisce una sezione trasversale (riga/e o colonna/e) da DataFrame.
    DataFrame.get () Ottieni l`elemento dall`oggetto per una determinata chiave (colonna DataFrame, sezione del pannello, ecc.).
    DataFrame.isin () Restituisce DataFrame booleano che mostra se ogni elemento in il DataFrame è contenuto nei valori.
    DataFrame.where () Restituisce un oggetto della stessa forma di self e le cui voci corrispondenti provengono da self dove cond è True e altrimenti provengono da other.< /td>

    Shop

    Learn programming in R: courses

    $

    Best Python online courses for 2022

    $

    Best laptop for Fortnite

    $

    Best laptop for Excel

    $

    Best laptop for Solidworks

    $

    Best laptop for Roblox

    $

    Best computer for crypto mining

    $

    Best laptop for Sims 4

    $

    Latest questions

    NUMPYNUMPY

    psycopg2: insert multiple rows with one query

    12 answers

    NUMPYNUMPY

    How to convert Nonetype to int or string?

    12 answers

    NUMPYNUMPY

    How to specify multiple return types using type-hints

    12 answers

    NUMPYNUMPY

    Javascript Error: IPython is not defined in JupyterLab

    12 answers


    Wiki

    Python OpenCV | cv2.putText () method

    numpy.arctan2 () in Python

    Python | os.path.realpath () method

    Python OpenCV | cv2.circle () method

    Python OpenCV cv2.cvtColor () method

    Python - Move item to the end of the list

    time.perf_counter () function in Python

    Check if one list is a subset of another in Python

    Python os.path.join () method