Rzućmy okiem na przykład indeksowania w Pandas. W tym artykule używamy pliku „nba.csv
”, aby przesłać CSV, kliknij tutaj .
Wybór wielu wierszy i wielu kolumn
Weźmy DataFrame z fałszywymi danymi, teraz je indeksujemy DataFrame. W tym celu wybieramy wiele wierszy i wiele kolumn z DataFrame. Ramka danych z zestawem danych.

Załóżmy, że chcemy wybrać tylko kolumny Wiek
, Uczelnia
i Wynagrodzenie
dla wierszy oznaczonych Amir Johnson
i Terry Rozier

Nasza ostatnia ramka DataFrame w źle wygląda tak:

Wybierz wiele wierszy i wszystkie kolumny
Powiedzmy, że chcemy wybrać wiersz Amir Jhonson
, Terry Rozier
i John Holland
ze wszystkimi kolumnami w ramce danych .

Nasza ostatnia ramka DataFrame będzie wyglądać tak:

Zaznaczanie niektórych kolumn i wszystkich wierszy
Powiedzmy, że chcemy wybierz kolumny Wiek, Wzrost i Wynagrodzenie ze wszystkimi wierszami w ramce danych.

Nasza ostatnia ramka DataFrame będzie wyglądać tak:

Indeksowanie pand za pomocą []
, .loc []
, . iloc []
, Dataframe .loc [] : ta funkcja jest używana do etykiet. Dataframe.iloc [] : to funkcja jest używana dla pozycji lub liczb całkowitych Dataframe.ix [] : ta funkcja jest używana zarówno dla etykiet, jak i liczb całkowitych. Łącznie nazywa się je indeksatorami . Są to zdecydowanie najczęstsze sposoby indeksowania danych. Są to cztery funkcje, które pomagają uzyskać elementy, wiersze i kolumny z DataFrame.
Indeksowanie Dataframe za pomocą operatora indeksowania []
: < br>Indeksowanie operatorów jest używane w odniesieniu do nawiasów kwadratowych znajdujących się za obiektem. W , index_col
=
"Nazwa"
)
# wyodrębnianie kolumn za pomocą operatora indeksu
pierwszy
=
dane [
"Wiek"
]
print
(pierwszy)
Łącznie nazywa się je indeksatorami . Są to zdecydowanie najczęstsze sposoby indeksowania danych. Są to cztery funkcje, które pomagają uzyskać elementy, wiersze i kolumny z DataFrame.
Indeksowanie Dataframe za pomocą operatora indeksowania []
: < br>Indeksowanie operatorów jest używane w odniesieniu do nawiasów kwadratowych znajdujących się za obiektem. W
, index_col
=
"Nazwa"
)
# wyodrębnianie kolumn za pomocą operatora indeksu
pierwszy
=
dane [
"Wiek"
]
print
(pierwszy)
Wyjście:
Wybieranie wielu kolumn
Aby wybrać wiele kolumn, musimy przekazać listę kolumn w instrukcji indeksowania .
# importuj pakiet pandy
importuj
# utwórz ramkę danych z pliku CSV
data
=
pd.read_csv (
"nba.csv"
, index_col
=
" Name "
)
# pobierz wiele kolumn za pomocą operatora indeksu
pierwszy
=
dane [[
"Wiek"
,
"College"
,
"Salary"
]]
cod e>
pierwszy
Wyjście:

Indeksowanie ramki DataFrame przy użyciu
, index_col
=
"Nazwa"
)
# wyodrębnij odczytywanie ciągów za pomocą metody loc
first
= < /kod>
"Avery Bradley"
]
drugi
=
data.loc [
"RJ Hunter"
]
print
(pierwszy,
""
, drugi)
Dane wyjściowe:
Jak pokazano na obrazie wyjściowym, zostały zwrócone dwie serie, ponieważ za każdym razem był tylko jeden parametr.

Aby wybrać wiele wierszy, umieszczamy wszystkie etykiety wierszy na liście i przekazujemy je do funkcji . loc
.
importuj
pandy jako pd
# utwórz ramkę danych z pliku CSV
dane
=
pd.read_csv (
"nba.csv"
, index_col
=
"Name"
)
# uzyskaj wiele wierszy za pomocą metody loc
najpierw
=
data.loc [[
"Avery Bradley"
,
" RJ Hunter ”
]]
print
(pierwszy)
Dane wyjściowe:
Wybieranie dwóch wierszy i trzech kolumn
Aby wybrać dwa wiersze i trzy kolumny, wybieramy dwa wiersze chcemy wybrać i trzy kolumny i umieścić je na osobnej liście w następujący sposób:
Dataframe.loc [["wiersz1", "wiersz2"], ["kolumna1", "kolumna2", "column3"]]
importuj
pandy jako pd
# utwórz ramkę danych z pliku CSV
dane
=
pd.read_csv (
"nba.csv"
, index_col
=
"Name"
)
# ekstrakcji dwa wiersze i trzy kolumny przy użyciu metody loc
first
=
data.loc [[
"Avery Bradley"
,
"RJ Hunter"
] ,
[
"Zespół"
,
"Number"
,
"Pozycja"
]]
print
(pierwszy)
Dane wyjściowe:

Zaznaczanie wszystkich wierszy i niektórych kolumn
Aby zaznaczyć wszystkie wiersze i niektóre kolumn, używamy pojedynczego dwukropka [:], do zaznaczenia wszystkich wierszy i listy niektórych kolumn, które chcemy wybrać w następujący sposób:
Dataframe.loc [[: , ["kolumna1", "kolumna2", "kolumna3"]]
|
Wyjście:

Indeksowanie DataFrame za pomocą . iloc []
:
Ta funkcja pozwala nam uzyskać wiersze i kolumny według pozycji. Aby to zrobić, musimy określić pozycje potrzebnych nam wierszy, a także pozycje potrzebnych nam kolumn. df.iloc
jest bardzo podobny do df.loc
, ale do wyboru używa tylko lokalizacji liczb całkowitych.
Pojedyncza linia wybór
Aby wybrać jedną linię za pomocą .iloc []
, możemy przekazać jedną liczbę całkowitą do .iloc []
.
|
Wyjście:

, index_col
=
"Name"
)
# pobieranie wielu wierszy metodą iloc
row2
=
data.iloc [[
3
,
5
,
7
]]
row2
Wyjście:

Wybieranie dwóch wierszy i dwóch kolumn
Aby wybrać dwa wiersze i dwie kolumny, tworzymy listę 2 liczb całkowitych dla łańcuchów i listę 2 liczb całkowitych dla kolumn, a następnie przekazujemy funkcję .iloc []
.
importuj
pandy jako pd
# utwórz ramkę danych z plik CSV
dane
=
pd.read_csv (
"nba.csv"
, index_col
=
"Name"
)
# ekstrakcji dwóch wierszy i dwóch kolumn przy użyciu metody iloc
row2
=
data.iloc [[[
3
,
4
], [
1
,
2
]]
print
(row2)
Wyjście:

Zaznacz wszystkie wiersze i niektóre kolumny
Aby zaznaczyć wszystkie wiersze i w niektórych kolumnach używamy pojedynczego dwukropka [:], do zaznaczenia wszystkich wierszy i fo r kolumn, tworzymy listę liczb całkowitych, a następnie przekazujemy funkcję .iloc []
.
importuj
pandy jako pd
# utwórz ramkę danych z pliku CSV
dane
=
pd.read_csv (
"nba.csv"
, index_col
=
"Nazwa"
)
# wyodrębnianie wszystkich wierszy i niektórych kolumn metodą iloc
row2
=
data.iloc [:, [
1
,
2
]]
print
(row2)
Wyjście:

Indeksowanie przy użyciu ramki danych .ix [] jako Aby wybrać jeden wiersz, umieszczamy etykietę pojedynczego wiersza w funkcji .loc []
.ix
. Ta funkcja działa jak .loc [] jeśli przekażemy etykietę linii jako argument do funkcji.
|
Wyjście:

Wybór jednej linii za pomocą .ix []
as , index_col
=
"Name"
)
# pobieranie ciągu za pomocą metody ix
pierwszy
=
data.ix [
1
]
print
(pierwszy)
tbody >
, index_col
=
"Name"
)
# pobieranie ciągu za pomocą metody ix
pierwszy
=
data.ix [
1
]
print
(pierwszy)
Wyjście:
< figure class = aligncenter amp-wp-inline-71b6f2deb98f54bf23d07f2b79530929>
Metody indeksowania w DataFrame
Funkcja | |
---|---|
Dataframe.head () | Zwróć n wierszy na górę ramki danych. |
Dataframe.tail () | Zwróć dolne n wierszy ramki danych. |
Dataframe.at [] | Dostęp do pojedynczej wartości dla pary etykiet wiersz/kolumna. |
Dataframe.iat [] | Dostęp do pojedynczej wartości dla pary wiersz/kolumna według pozycji liczby całkowitej . |
Dataframe.tail () | Indeksowanie oparte wyłącznie na liczbach całkowitych do wyboru według pozycji. |
DataFrame.lookup () | Oparta na etykietach funkcja „fantazyjnego indeksowania” dla DataFrame. | < /tr>
DataFrame .pop () | Zwróć element i upuść z ramki. |
DataFrame.xs() | Zwraca przekrój (wiersze lub kolumny) z elementu DataFrame. |
DataFrame.get () | Pobierz element z obiektu dla danego klucza (kolumna DataFrame, wycinek panelu itp.). |
DataFrame.isin () | Zwraca wartość logiczną DataFrame pokazującą, czy każdy element w DataFrame jest zawarta w wartościach. |
DataFrame.where () | Zwraca obiekt o takim samym kształcie jak self i którego odpowiednie wpisy pochodzą od self, gdzie cond jest prawdą, a w przeciwnym razie pochodzą z other.< /td> |
ShopLatest questions Wiki |