Indexando e selecionando dados com pandas

| | | | | | | | |

Vamos dar uma olhada em um exemplo de indexação no Pandas. Neste artigo, estamos usando o arquivo "nba.csv ‚" para fazer upload de CSV, clique em aqui .

Seleção de várias linhas e várias colunas

Vamos pegar um DataFrame com alguns dados falsos, agora estamos indexando isso DataFrame. Nele, selecionamos várias linhas e várias colunas do DataFrame. Quadro de dados com conjunto de dados.

Suponha que queremos selecionar apenas as colunas Idade , Faculdade e Salary para linhas rotuladas Amir Johnson e Terry Rozier

Nosso último DataFrame w ficará assim:

Selecionar várias linhas e todas as colunas

Digamos que queremos selecionar a linha Amir Jhonson , Terry Rozier e John Holland com todas as colunas no dataframe .

Nosso último DataFrame ficará assim:

Selecionando algumas colunas e todas as linhas

Digamos que queremos selecione as colunas Idade, Altura e Salário com todas as linhas no dataframe.

Nosso último DataFrame ficará assim:

< /figure>

Indexando pandas usando [] , .loc [] , . iloc [] , Dataframe .loc [] : esta função é usada para rótulos.
  • Dataframe.iloc [] : isso função é usada para posições ou inteiros
  • Dataframe.ix [] : esta função é usada para rótulos e inteiros.
  • Coletivamente, eles são chamados de indexadores . Essas são, de longe, as formas mais comuns de indexar dados. Estas são quatro funções que ajudam você a obter elementos, linhas e colunas de um DataFrame.

    Indexar um Dataframe usando o operador de indexação [] : < br>A indexação de operador é usada para se referir a colchetes após um objeto. Em , index_col = "Nome" )


    # extraindo colunas usando o operador de índice

    primeiro = dados [ "Idade" ]



    print (primeiro)

    Sair:

    Selecionando várias colunas

    Para selecionar várias colunas, devemos passar uma lista de colunas na instrução de indexação .


    # importa pacote pandas

    import pa n das as pd


    # cria data frame do arquivo CSV

    dados = pd.read_csv ( "nba.csv" code> , index_col = " Nome " )


    # busca várias colunas usando o operador de índice

    primeiro = dados [[ "Idade" , "Faculdade" , "Salário" ]]




    primeiro

    Sair:

    Indexação do DataFrame usando , index_col = "Nome" )


    # extrai a leitura de string usando o método loc

    primeiro = data .loc [ "Avery Bradley" ]

    segundo = data.loc [ "RJ Hunter" ]



    print (primeiro, "" , segundo)

    Saída:
    Como mostrado na imagem de saída, duas séries foram retornadas, pois havia apenas um parâmetro nas duas vezes.


    Selecionando várias linhas

    Para selecionar várias linhas, colocamos todos os rótulos de linha em uma lista e os passamos para a função . loc .


    import pandas as pd


    # cria data frame do arquivo CSV

    data = pd.read_csv ( "nba.csv" , index_col = "Nome" )


    # obtém várias linhas usando o método loc

    primeiro = data.loc [[ "Avery Bradley" , " RJ Hunter " ]]

    print (primeiro)

    < /tr>

    Saída:

    Selecionando duas linhas e três colunas

    Para selecionar duas linhas e três colunas, selecionamos as duas linhas queremos selecionar e três colunas e colocá-las em uma lista separada como esta:


     Dataframe.loc [["row1", "row2"], ["column1", "column2", "column3"] ] 

    import pandas como pd


    # cria quadro de dados do arquivo CSV

    dados = pd.read_csv ( "nba.csv" , index_col = "Nome" )


    # extração duas linhas e três colunas usando o método loc

    primeiro = data.loc [[ "Avery Bradley" , "RJ Hunter" ] ,

    [ "Equipe" , "Número" , "Posição" ]]



    print (primeiro)

    Saída:


    Selecionando todas as linhas e algumas colunas

    Para selecionar todas as linhas e algumas colunas, usamos dois pontos [:], para selecionar todas as linhas e uma lista de algumas das colunas que desejamos selecionar da seguinte forma:

     Dataframe.loc [[: , ["column1", "column2", "column3"]] 

    < tbody>

    import pandas as pd


    # cria data frame a partir de arquivo CSV

    data = pd.read_csv ( "nba.csv" , index_col = "Nome" )


    # busca todas as linhas e algumas colunas usando o método loc

    first = data.loc [:, [ "Equipe" , "Número" , "Posição" ]]



    print ( primeiro)

    Sair:

    Indexando DataFrame usando . iloc [] :
    Esta função nos permite obter linhas e colunas por posição. Para fazer isso, precisamos especificar as posições das linhas que precisamos, bem como as posições das colunas que precisamos. df.iloc é muito semelhante a df.loc , mas usa apenas locais inteiros para seleção.

    Linha única seleção

    Para selecionar uma linha usando .iloc [] , podemos passar um inteiro para .iloc [] .

    import pandas as pd


    # cria data frame do arquivo CSV

    dados = pd.read_csv ( "nba.csv" , index_col = "Nome" )



    # extração iloc de linhas

    linha2 = data.iloc [ 3 ]




    imprimir (linha2)

    Sair:


    , index_col = "Name" )



    # obtendo várias linhas usando o método iloc

    linha2 = data.iloc [[ 3 , 5 , 7 ]]




    linha2

    Sair:


    Selecionando duas linhas e duas colunas

    Para selecionar duas linhas e duas colunas, criamos uma lista de 2 inteiros para strings e uma lista de 2 inteiros para colunas, e então passamos a função .iloc [] .


    import pandas as pd


    # cria data frame de Arquivo CSV

    dados = pd.read_csv ( "nba.csv" , index_col = "Nome" )



    # extração de duas linhas e duas colunas usando o método iloc

    row2 = data.iloc [[[ 3 , 4 ], [ 1 , 2 ]]

    print (row2)

    Sair:

    Selecione todas as linhas e algumas colunas

    Para selecionar todas as linhas e algumas colunas, usamos dois pontos [:], para selecionar todas as linhas e fo r colunas, compomos uma lista de inteiros e então passamos a função .iloc [] .



    import pandas as pd


    # cria data frame do arquivo CSV

    dados = pd.read_csv ( "nba.csv" , index_col = "Nome" )



    # extração de todas as linhas e algumas colunas usando o método iloc

    row2 = data.iloc [:, [ 1 , 2 ]]

    print (row2)

    Sair:

    Indexação usando .ix [] as . loc []

    Para selecionar uma linha, colocamos um rótulo de linha única na função . ix . Essa função funciona como .loc [] se passarmos o rótulo da linha como um argumento para a função.


    # importar pacote pandas

    importar pandas as pd


    # cria data frame do arquivo CSV

    dados = pd.read_csv ( " nba.csv " , index_col = "Nome" )


    # obtendo uma string usando o método ix

    primeiro = data.ix [ "Avery Bradley" ]




    print (primeiro)

    Sair:

    Selecionando uma linha usando . ix [] como code> , index_col = "Nome" )


    # obtendo uma string usando o método ix

    primeiro = data.ix [ 1 ]


    print (primeiro)

    Sair:

    < figure class = aligncenter amp-wp-inline-71b6f2deb98f54bf23d07f2b79530929>


    Métodos de indexação em DataFrame

    < /tr>
    Função Descrição
    Dataframe.head () Retorna n linhas superiores de um quadro de dados.
    Dataframe.tail () Retorna n linhas inferiores de um quadro de dados.
    Dataframe.at [] Acesse um único valor para um par de rótulos de linha/coluna.
    Dataframe.iat [] Acesse um único valor para um par de linha/coluna por posição inteira.
    Dataframe.tail () Indexação puramente baseada em localização inteira para seleção por posição.
    DataFrame.lookup () Função "indexação sofisticada‚"" baseada em rótulo para DataFrame.
    DataFrame .pop() Retornar item e soltar do quadro.
    DataFrame.xs() Retorna uma seção transversal (linha(s) ou coluna(s)) do DataFrame.
    DataFrame.get () Obter item do objeto para determinada chave (coluna DataFrame, fatia do painel etc.).
    DataFrame.isin () Retorna boolean DataFrame mostrando se cada elemento em o DataFrame está contido em valores.
    DataFrame.where () Retorna um objeto da mesma forma que self e cujas entradas correspondentes são de self onde cond é True e caso contrário são de other.< /td>

    Shop

    Learn programming in R: courses

    $

    Best Python online courses for 2022

    $

    Best laptop for Fortnite

    $

    Best laptop for Excel

    $

    Best laptop for Solidworks

    $

    Best laptop for Roblox

    $

    Best computer for crypto mining

    $

    Best laptop for Sims 4

    $

    Latest questions

    NUMPYNUMPY

    psycopg2: insert multiple rows with one query

    12 answers

    NUMPYNUMPY

    How to convert Nonetype to int or string?

    12 answers

    NUMPYNUMPY

    How to specify multiple return types using type-hints

    12 answers

    NUMPYNUMPY

    Javascript Error: IPython is not defined in JupyterLab

    12 answers


    Wiki

    Python OpenCV | cv2.putText () method

    numpy.arctan2 () in Python

    Python | os.path.realpath () method

    Python OpenCV | cv2.circle () method

    Python OpenCV cv2.cvtColor () method

    Python - Move item to the end of the list

    time.perf_counter () function in Python

    Check if one list is a subset of another in Python

    Python os.path.join () method