Vamos dar uma olhada em um exemplo de indexação no Pandas. Neste artigo, estamos usando o arquivo "nba.csv
‚" para fazer upload de CSV, clique em aqui .
Seleção de várias linhas e várias colunas
Vamos pegar um DataFrame com alguns dados falsos, agora estamos indexando isso DataFrame. Nele, selecionamos várias linhas e várias colunas do DataFrame. Quadro de dados com conjunto de dados.

Suponha que queremos selecionar apenas as colunas Idade
, Faculdade
e Salary
para linhas rotuladas Amir Johnson
e Terry Rozier

Nosso último DataFrame w ficará assim:

Selecionar várias linhas e todas as colunas
Digamos que queremos selecionar a linha Amir Jhonson
, Terry Rozier
e John Holland
com todas as colunas no dataframe .

Nosso último DataFrame ficará assim:

Selecionando algumas colunas e todas as linhas
Digamos que queremos selecione as colunas Idade, Altura e Salário com todas as linhas no dataframe.

Nosso último DataFrame ficará assim:

Indexando pandas usando []
, .loc []
, . iloc []
, Dataframe .loc [] : esta função é usada para rótulos. Dataframe.iloc [] : isso função é usada para posições ou inteiros Dataframe.ix [] : esta função é usada para rótulos e inteiros. Coletivamente, eles são chamados de indexadores . Essas são, de longe, as formas mais comuns de indexar dados. Estas são quatro funções que ajudam você a obter elementos, linhas e colunas de um DataFrame.
Indexar um Dataframe usando o operador de indexação []
: < br>A indexação de operador é usada para se referir a colchetes após um objeto. Em , index_col
=
"Nome"
)
# extraindo colunas usando o operador de índice
primeiro
=
dados [
"Idade"
]
print
(primeiro)
Coletivamente, eles são chamados de indexadores . Essas são, de longe, as formas mais comuns de indexar dados. Estas são quatro funções que ajudam você a obter elementos, linhas e colunas de um DataFrame.
Indexar um Dataframe usando o operador de indexação []
: < br>A indexação de operador é usada para se referir a colchetes após um objeto. Em
, index_col
=
"Nome"
)
# extraindo colunas usando o operador de índice
primeiro
=
dados [
"Idade"
]
print
(primeiro)
Sair:
Selecionando várias colunas
Para selecionar várias colunas, devemos passar uma lista de colunas na instrução de indexação .
# importa pacote pandas
import
# cria data frame do arquivo CSV
dados
=
pd.read_csv (
"nba.csv"
code> , index_col
=
" Nome "
)
# busca várias colunas usando o operador de índice
primeiro
=
dados [[
"Idade"
,
"Faculdade"
,
"Salário"
]]
cod e>
primeiro
Sair:

Indexação do DataFrame usando
, index_col
=
"Nome"
)
# extrai a leitura de string usando o método loc
primeiro
=
"Avery Bradley"
]
segundo
=
data.loc [
"RJ Hunter"
]
print
(primeiro,
""
, segundo)
Saída:
Como mostrado na imagem de saída, duas séries foram retornadas, pois havia apenas um parâmetro nas duas vezes.

Selecionando várias linhas
Para selecionar várias linhas, colocamos todos os rótulos de linha em uma lista e os passamos para a função . loc
.
import
pandas as pd
# cria data frame do arquivo CSV
data
=
pd.read_csv (
"nba.csv"
, index_col
=
"Nome"
)
# obtém várias linhas usando o método loc
primeiro
=
data.loc [[
"Avery Bradley"
,
" RJ Hunter "
]]
print
(primeiro)
Saída:
Selecionando duas linhas e três colunas
Para selecionar duas linhas e três colunas, selecionamos as duas linhas queremos selecionar e três colunas e colocá-las em uma lista separada como esta:
Dataframe.loc [["row1", "row2"], ["column1", "column2", "column3"] ]
import
pandas como pd
# cria quadro de dados do arquivo CSV
dados
=
pd.read_csv (
"nba.csv"
, index_col
=
"Nome"
)
# extração duas linhas e três colunas usando o método loc
primeiro
=
data.loc [[
"Avery Bradley"
,
"RJ Hunter"
] ,
[
"Equipe"
,
"Número"
,
"Posição"
]]
print
(primeiro)
Saída:

Selecionando todas as linhas e algumas colunas
Para selecionar todas as linhas e algumas colunas, usamos dois pontos [:], para selecionar todas as linhas e uma lista de algumas das colunas que desejamos selecionar da seguinte forma:
Dataframe.loc [[: , ["column1", "column2", "column3"]]
|
Sair:

Indexando DataFrame usando . iloc []
:
Esta função nos permite obter linhas e colunas por posição. Para fazer isso, precisamos especificar as posições das linhas que precisamos, bem como as posições das colunas que precisamos. df.iloc
é muito semelhante a df.loc
, mas usa apenas locais inteiros para seleção.
Linha única seleção
Para selecionar uma linha usando .iloc []
, podemos passar um inteiro para .iloc []
.
|
Sair:

, index_col
=
"Name"
)
# obtendo várias linhas usando o método iloc
linha2
=
data.iloc [[
3
,
5
,
7
]]
linha2
Sair:

Selecionando duas linhas e duas colunas
Para selecionar duas linhas e duas colunas, criamos uma lista de 2 inteiros para strings e uma lista de 2 inteiros para colunas, e então passamos a função .iloc []
.
import
pandas as pd
# cria data frame de Arquivo CSV
dados
=
pd.read_csv (
"nba.csv"
, index_col
=
"Nome"
)
# extração de duas linhas e duas colunas usando o método iloc
row2
=
data.iloc [[[
3
,
4
], [
1
,
2
]]
print
(row2)
Sair:

Selecione todas as linhas e algumas colunas
Para selecionar todas as linhas e algumas colunas, usamos dois pontos [:], para selecionar todas as linhas e fo r colunas, compomos uma lista de inteiros e então passamos a função .iloc []
.
import
pandas as pd
# cria data frame do arquivo CSV
dados
=
pd.read_csv (
"nba.csv"
, index_col
=
"Nome"
)
# extração de todas as linhas e algumas colunas usando o método iloc
row2
=
data.iloc [:, [
1
,
2
]]
print
(row2)
Sair:

Indexação usando .ix [] as Para selecionar uma linha, colocamos um rótulo de linha única na função . loc []
. ix
. Essa função funciona como .loc [] se passarmos o rótulo da linha como um argumento para a função.
|
Sair:

Selecionando uma linha usando . ix []
como code> , index_col
=
"Nome"
)
# obtendo uma string usando o método ix
primeiro
=
data.ix [
1
]
print
(primeiro)
tbody >
, index_col
=
"Nome"
)
# obtendo uma string usando o método ix
primeiro
=
data.ix [
1
]
print
(primeiro)
Sair:
< figure class = aligncenter amp-wp-inline-71b6f2deb98f54bf23d07f2b79530929>
Métodos de indexação em DataFrame
Função | Descrição |
---|---|
Dataframe.head () | Retorna n linhas superiores de um quadro de dados. |
Dataframe.tail () | Retorna n linhas inferiores de um quadro de dados. |
Dataframe.at [] | Acesse um único valor para um par de rótulos de linha/coluna. |
Dataframe.iat [] | Acesse um único valor para um par de linha/coluna por posição inteira. |
Dataframe.tail () | Indexação puramente baseada em localização inteira para seleção por posição. |
DataFrame.lookup () | Função "indexação sofisticada‚"" baseada em rótulo para DataFrame. | < /tr>
DataFrame .pop() | Retornar item e soltar do quadro. |
DataFrame.xs() | Retorna uma seção transversal (linha(s) ou coluna(s)) do DataFrame. |
DataFrame.get () | Obter item do objeto para determinada chave (coluna DataFrame, fatia do painel etc.). |
DataFrame.isin () | Retorna boolean DataFrame mostrando se cada elemento em o DataFrame está contido em valores. |
DataFrame.where () | Retorna um objeto da mesma forma que self e cujas entradas correspondentes são de self onde cond é True e caso contrário são de other.< /td> |
ShopLatest questions Wiki |