Limpar dados de string no dataframe Pandas especificado

| | | |

Suponha que estamos lidando com dados de um site de comércio eletrônico. Os nomes dos produtos não estão no formato correto. Formate os dados corretamente para que não haja espaços à esquerda e à direita, e as primeiras letras de todos os produtos sejam maiúsculas.

Solução nº 1: Em muitos casos, nos deparamos com uma situação em que você precisa escrever sua própria função personalizada adequada para a tarefa em mãos.


# import pandas as pd

import pandas as pd


# Cria quadro de dados

df = pd.DataFrame ({ `Data` : [ `10/2 / 2011` , ` 11/2 / 2011` , `12/2/2011` , < código c lass ="string ">` 13/2 / 2011` ],

`Produto` : [ `UMbreLla` , ` maTress` , `BaDmintoN` , `Shuttle` ],

` Updated_Price` : [ 1250 , 1450 , 1550 , 400 ],

` Desconto` : [ 10 , 8 , 15 , 10 ]})


# Imprime o quadro de dados

print (df)

Saída:

Agora vamos escrever nossa própria função personalizada para resolver este problema.


def Format_data (df):

# iterar em todas as linhas

para i em intervalo (df.shape [ 0 ]):


# reatribui os valores ‚Äã‚Äãà coluna do produto

# primeiro remova os espaços usando a função strip()

# então capitalizamos com a função capitalize()

df. iat [i, 1 ] = df.iat [i, 1 ]. faixa (). capitalize()


# Vamos chamar a função
Format_data (df )


# Imprime o Dataframe

print (df)

Saída:

Solução nº 2: Agora veremos uma abordagem melhor e mais eficiente usando o Pandas function DataFrame.apply() .


# import pandas as pd

import pandas as pd


# Criar data frame

df = pd.DataFrame ( {` ` Data` : [ `10/2/2011` , `11/2/2011` , `12/2/2011` , ` 13/2 / 2011` ],

`Produto` : [ `UMbreLla` , ` maTress` , `BaDmintoN` , `Shuttle` ],

`Preço_atualizado` : [ 1250 , 1450 , 1550 , 400 ],

`Desconto` : [ 10 , 8 , 15 , 10 ]})


# Imprimir o quadro de dados

print (df)

Saída:

Vamos usar DataFrame.apply() Pandas DataFrame.apply() para formatar nomes de produtos no formato desejado. Dentro da função DataFrame.apply() do Pandas, usaremos uma função lambda.


# Usando o df.apply() em um produto de coluna

df [ `Product` ] = df [ `Produto ` ]. aplicar ( lambda x: x.strip (). capitalize ())


# Imprime o Dataframe

print (df)

Saída :

Shop

Learn programming in R: courses

$

Best Python online courses for 2022

$

Best laptop for Fortnite

$

Best laptop for Excel

$

Best laptop for Solidworks

$

Best laptop for Roblox

$

Best computer for crypto mining

$

Best laptop for Sims 4

$

Latest questions

NUMPYNUMPY

psycopg2: insert multiple rows with one query

12 answers

NUMPYNUMPY

How to convert Nonetype to int or string?

12 answers

NUMPYNUMPY

How to specify multiple return types using type-hints

12 answers

NUMPYNUMPY

Javascript Error: IPython is not defined in JupyterLab

12 answers


Wiki

Python OpenCV | cv2.putText () method

numpy.arctan2 () in Python

Python | os.path.realpath () method

Python OpenCV | cv2.circle () method

Python OpenCV cv2.cvtColor () method

Python - Move item to the end of the list

time.perf_counter () function in Python

Check if one list is a subset of another in Python

Python os.path.join () method