Suponha que estamos lidando com dados de um site de comércio eletrônico. Os nomes dos produtos não estão no formato correto. Formate os dados corretamente para que não haja espaços à esquerda e à direita, e as primeiras letras de todos os produtos sejam maiúsculas.
Solução nº 1: Em muitos casos, nos deparamos com uma situação em que você precisa escrever sua própria função personalizada adequada para a tarefa em mãos.
# import pandas as pd
import
pandas as pd
# Cria quadro de dados
df
=
pd.DataFrame ({
`Data`
: [
`10/2 / 2011`
,
` 11/2 / 2011`
,
`12/2/2011`
,
< código c lass ="string ">` 13/2 / 2011` ],
`Produto`
: [
`UMbreLla`
,
` maTress`
,
`BaDmintoN`
,
`Shuttle`
],
` Updated_Price`
: [
1250
,
1450
,
1550
,
400
],
` Desconto`
: [
10
,
8
,
15
,
10
]})
# Imprime o quadro de dados
print
(df)
Saída:
Agora vamos escrever nossa própria função personalizada para resolver este problema.
def
Format_data (df):
# iterar em todas as linhas
para
em
intervalo
(df.shape [
0
]):
# reatribui os valores ‚Äã‚Äãà coluna do produto
# primeiro remova os espaços usando a função strip()
# então capitalizamos com a função capitalize()
df. iat [i,
1
]
=
df.iat [i,
1
]. faixa (). capitalize()
# Vamos chamar a função
Format_data (df )
# Imprime o Dataframe
print
(df)
Saída:
Solução nº 2: Agora veremos uma abordagem melhor e mais eficiente usando o Pandas function DataFrame.apply()
.
Saída: Vamos usar
Saída : ShopLatest questions Wiki |