Supposons que nous ayons affaire à des données provenant d`un site de commerce électronique. Les noms de produits ne sont pas au bon format. Formatez les données correctement afin qu`il n`y ait pas d`espaces de début et de fin, et que les premières lettres de tous les produits soient en majuscules.
Solution n° 1 : Dans de nombreux cas, nous sommes confrontés à une situation où vous devez écrire votre propre fonction personnalisée adaptée à la tâche à accomplir.
# import pandas as pd
importer
pandas en tant que pd
# Créer une trame de données
df
=
pd.DataFrame ({
`Date`
: [
`10/2/2011`
,
` 11/2/2011`
,
`12/2 / 2011`
,
` 13/2 / 2011`
],
`Produit`
: [
`UMbreLla`
,
` maTress`
,
`BaDmintoN`
,
`Navette `
],
` Updated_Price`
: [
1250
,
1450
,
1550
,
400
],
` Remise`
: [
10
,
8
,
15
,
10
]})
# Imprimer le bloc de données
print
(df)
Sortie :
Nous allons maintenant écrire notre propre fonction personnalisée pour résoudre ce problème.
def
Format_data (df):
# itérer sur toutes les lignes
for
in
range
(df.shape [
0
]):
# réassigner les valeurs ‚Äã‚Äãà la colonne produit
# supprimer d`abord les espaces à l`aide de la fonction strip ()
# puis on capitalise avec la fonction capitalize()
df. iat [i,
1
]
=
df.iat [i,
1
]. déshabiller (). capitalize ( )
# Allons appeler la fonction
Format_data (df )
# Imprimer le Dataframe
imprimer
(df)
Sortie :
Solution # 2 : Nous allons maintenant voir une approche meilleure et plus efficace en utilisant les Pandas fonction DataFrame.apply ()
.
Sortie : Utilisons
Sortie : ShopLatest questions Wiki |