Diamo un`occhiata a un esempio di indicizzazione in Pandas. In questo articolo utilizziamo il file "nba.csv
‚" per caricare CSV, fare clic su qui .
Selezione di più righe e più colonne
Prendiamo un DataFrame con alcuni dati falsi, ora lo stiamo indicizzando DataFrame. In questo, selezioniamo più righe e più colonne da DataFrame. Data frame con set di dati.

Supponiamo di voler selezionare solo le colonne Età
, Università
e Stipendio
per le righe etichettate Amir Johnson
e Terry Rozier

Il nostro ultimo DataFrame w ill aspetto così:

Seleziona più righe e tutte le colonne
Diciamo di voler selezionare la riga Amir Jhonson
, Terry Rozier
e John Holland
con tutte le colonne nel dataframe .

Il nostro ultimo DataFrame sarà simile a questo:

Selezione di alcune colonne e di tutte le righe
Diciamo di voler seleziona le colonne Età, Altezza e Stipendio con tutte le righe nel dataframe.

Il nostro ultimo DataFrame sarà simile al seguente:

Indicizzazione dei panda usando []
, .loc []
, . iloc []
, Dataframe .loc [] : questa funzione viene utilizzata per le etichette. Dataframe.iloc [] : questo viene utilizzata per posizioni o numeri interi Dataframe.ix [] : questa funzione viene utilizzata sia per le etichette che per i numeri interi. Collettivamente sono chiamati indicizzatori . Questi sono di gran lunga i modi più comuni per indicizzare i dati. Queste sono quattro funzioni che ti aiutano a ottenere elementi, righe e colonne da un DataFrame.
Indicizzazione di un Dataframe usando l`operatore di indicizzazione []
: < br>L`indicizzazione dell`operatore viene utilizzata per fare riferimento a parentesi quadre che seguono un oggetto. In , index_col
=
"Nome"
)
# estrazione di colonne utilizzando l`operatore indice
first
=
data [
"Età"
]
print
(prima)
Collettivamente sono chiamati indicizzatori . Questi sono di gran lunga i modi più comuni per indicizzare i dati. Queste sono quattro funzioni che ti aiutano a ottenere elementi, righe e colonne da un DataFrame.
Indicizzazione di un Dataframe usando l`operatore di indicizzazione []
: < br>L`indicizzazione dell`operatore viene utilizzata per fare riferimento a parentesi quadre che seguono un oggetto. In
, index_col
=
"Nome"
)
# estrazione di colonne utilizzando l`operatore indice
first
=
data [
"Età"
]
print
(prima)
Esci:
Selezione di più colonne
Per selezionare più colonne, dobbiamo passare un elenco di colonne nell`istruzione di indicizzazione .
# import pacchetto pandas
import
# crea frame di dati dal file CSV
data
=
pd.read_csv (
"nba.csv"
, index_col
=
" Nome "
)
# recupera più colonne utilizzando l`operatore di indice
first
=
dati [[
"Età"
,
"College"
,
"Salario"
]]
first
Esci:

Indicizzazione del DataFrame utilizzando
, index_col
# estrae la lettura della stringa usando il metodo loc
first
= < /codice>
"Avery Bradley"
]
secondo
=
data.loc [
"RJ Hunter"
]
print
(primo,
""
, secondo)
Output:
Come mostrato nell`immagine di output, sono state restituite due serie poiché entrambe le volte era presente un solo parametro.

Selezione righe multiple
Per selezionare più righe, inseriamo tutte le etichette di riga in un elenco e le passiamo alla funzione . loc
.
import
panda come pd
# crea frame di dati da file CSV
data
# ottieni più righe usando il metodo loc
first
=
data.loc [[
"Avery Bradley"
,
" RJ Hunter "
]]
print
(prima)
Output:
Selezione di due righe e tre colonne
Per selezionare due righe e tre colonne, selezioniamo le due righe vogliamo selezionare e tre colonne e inserirle in un elenco separato come questo:
Dataframe.loc [["row1", "row2"], ["column1", "column2", "column3"] ]
import
panda come pd
# crea frame di dati da file CSV
data
=
"Nome"
)
# estrazione due righe e tre colonne usando il metodo loc
first
=
data.loc [[
"Avery Bradley"
,
"RJ Hunter"
] ,
[
"Team"
,
"Numero"
,
"Posizione"
]]
print
(prima)
Output:

Selezione di tutte le righe e di alcune colonne
Per selezionare tutte le righe e alcune colonne, utilizziamo i due punti singoli [:], per selezionare tutte le righe e un elenco di alcune delle colonne che vogliamo selezionare come segue:
Dataframe.loc [[: , ["colonna1", "colonna2", "colonna3"]]
import
panda come pd
# crea frame di dati dal file CSV
data
=
pd.read_csv (
"nba.csv"
, index_col
first
=
data.loc [:, [
"Team"
,
print
( prima)
Esci:

Indicizzazione di DataFrame utilizzando . iloc []
:
Questa funzione ci permette di ottenere righe e colonne per posizione. Per fare ciò, dobbiamo specificare le posizioni delle righe di cui abbiamo bisogno, così come le posizioni delle colonne di cui abbiamo bisogno. df.iloc
è molto simile a df.loc
ma utilizza solo posizioni intere per la selezione.
Riga singola selezione
Per selezionare una riga utilizzando .iloc []
, possiamo passare un intero a .iloc []
.
|
Esci:

, index_col
=
"Nome"
)
# ottenere più righe usando il metodo iloc
3
,
5
,
row2
Esci:

Selezione di due righe e due colonne
Per selezionare due righe e due colonne, creiamo una lista di 2 interi per le stringhe e una lista di 2 interi per le colonne, quindi passiamo la funzione .iloc []
.
import
panda come pd
# crea frame di dati da File CSV
data
=
pd.read_csv (
"nba.csv"
, index_col
=
"Nome"
)
# estrazione di due righe e due colonne utilizzando il metodo iloc
row2
=
data.iloc [[[
3
,
4
], [
1
,
2
]]
print
(riga2)
Esci:

Seleziona tutte le righe e alcune colonne
Per selezionare tutte le righe e alcune colonne, utilizziamo i due punti singoli [:], per selezionare tutte le righe e fo r colonne, componiamo un elenco di interi e quindi passiamo la funzione .iloc []
.
import
panda come pd
# crea frame di dati da file CSV
dati
=
pd.read_csv (
"nba.csv"
, index_col
=
"Nome"
)
# estrazione di tutte le righe e di alcune colonne utilizzando il metodo iloc
row2
=
print
(riga2)
Esci:

Indicizzazione utilizzando .ix [] come Per selezionare una riga, mettiamo un`etichetta di riga singola nella funzione .loc []
.ix
. Questa funzione si comporta come .loc [] se passiamo l`etichetta della riga come argomento alla funzione.
|
Esci:

Selezione di una riga utilizzando .ix []
come , index_col
=
"Nome"
)
# ottenere una stringa usando il metodo ix
first
=
data.ix [
1
]
print
(prima)
tbody >
, index_col
=
"Nome"
)
# ottenere una stringa usando il metodo ix
first
=
data.ix [
1
]
print
(prima)
Esci:
< figure class = aligncenter amp-wp-inline-71b6f2deb98f54bf23d07f2b79530929>
Metodi di indicizzazione in DataFrame
Funzione | Descrizione |
---|---|
Dataframe.head () | Ritorna le prime n righe di un frame di dati. |
Dataframe.tail () | Restituisce le n righe inferiori di un frame di dati. |
Dataframe.at [] | Accedi a un singolo valore per una coppia di etichette riga/colonna. |
Dataframe.iat [] | Accedi a un valore singolo per una coppia riga/colonna in base alla posizione intera. |
Dataframe.tail () | Indicizzazione basata esclusivamente su posizioni intere per la selezione per posizione. |
DataFrame.lookup() | Funzione "indicizzazione fantasia‚" basata su etichette per DataFrame. | < /tr>
DataFrame .pop () | Ritorna l`elemento e rilascialo dal frame. |
DataFrame.xs() | Restituisce una sezione trasversale (riga/e o colonna/e) da DataFrame. |
DataFrame.get () | Ottieni l`elemento dall`oggetto per una determinata chiave (colonna DataFrame, sezione del pannello, ecc.). |
DataFrame.isin () | Restituisce DataFrame booleano che mostra se ogni elemento in il DataFrame è contenuto nei valori. |
DataFrame.where () | Restituisce un oggetto della stessa forma di self e le cui voci corrispondenti provengono da self dove cond è True e altrimenti provengono da other.< /td> |
ShopLatest questions Wiki |