Effacer les données de chaîne dans la trame de données Pandas spécifiée

| | | |

Supposons que nous ayons affaire à des données provenant d`un site de commerce électronique. Les noms de produits ne sont pas au bon format. Formatez les données correctement afin qu`il n`y ait pas d`espaces de début et de fin, et que les premières lettres de tous les produits soient en majuscules.

Solution n° 1 : Dans de nombreux cas, nous sommes confrontés à une situation où vous devez écrire votre propre fonction personnalisée adaptée à la tâche à accomplir.


# import pandas as pd

importer pandas en tant que pd


# Créer une trame de données

df = pd.DataFrame ({ `Date`  : [ `10/2/2011` , ` 11/2/2011` , `12/2 / 2011` , ` 13/2 / 2011` ],

`Produit`  : [ `UMbreLla` , ` maTress` , `BaDmintoN` , `Navette ` ],

` Updated_Price`  : [ 1250 , 1450 , 1550 , 400 ],

` Remise`  : [ 10 , 8 , 15 , 10 ]})


# Imprimer le bloc de données

print (df)

Sortie :

Nous allons maintenant écrire notre propre fonction personnalisée pour résoudre ce problème.


def Format_data (df):

# itérer sur toutes les lignes

for i in range (df.shape [ 0 ]):


# réassigner les valeurs ‚Äã‚Äãà la colonne produit

# supprimer d`abord les espaces à l`aide de la fonction strip ()

# puis on capitalise avec la fonction capitalize()

df. iat [i, 1 ] = df.iat [i, 1 ]. déshabiller (). capitalize ( )


# Allons appeler la fonction
Format_data (df )


# Imprimer le Dataframe

imprimer (df)

Sortie :

Solution # 2 : Nous allons maintenant voir une approche meilleure et plus efficace en utilisant les Pandas fonction DataFrame.apply () .


# importer des pandas en tant que pd

importer pandas as pd


# Créer un cadre de données

df = pd.DataFrame ( {` ` Date`  : [ `10/2/2011` , `11/2/2011` , `12/2 / 2011` , ` 13/2 / 2011` ],

`Produit`  : [ `UMbreLla` , ` maTress` , `BaDmintoN` , `Navette` ],

`Updated_Price`  : [ 1250 , 1450 , 1550 , 400 ],

`Remise`  : [ 10 , 8 , 15 , 10 ]})


# Imprimer le bloc de données

print (df)

Sortie :

Utilisons DataFrame.apply () Pandas DataFrame.apply () pour formater les noms de produits au format souhaité. Dans la fonction Pandas DataFrame.apply () , nous utiliserons une fonction lambda.


# Utilisation de la fonction df.apply() sur une colonne produit

df [ `Produit` ] = df [ `Produit ` ]. appliquer ( lambda x: x.strip (). capitalize ())


# Imprimer le Dataframe

print (df)

Sortie :
< / p>

Shop

Learn programming in R: courses

$

Best Python online courses for 2022

$

Best laptop for Fortnite

$

Best laptop for Excel

$

Best laptop for Solidworks

$

Best laptop for Roblox

$

Best computer for crypto mining

$

Best laptop for Sims 4

$

Latest questions

NUMPYNUMPY

psycopg2: insert multiple rows with one query

12 answers

NUMPYNUMPY

How to convert Nonetype to int or string?

12 answers

NUMPYNUMPY

How to specify multiple return types using type-hints

12 answers

NUMPYNUMPY

Javascript Error: IPython is not defined in JupyterLab

12 answers


Wiki

Python OpenCV | cv2.putText () method

numpy.arctan2 () in Python

Python | os.path.realpath () method

Python OpenCV | cv2.circle () method

Python OpenCV cv2.cvtColor () method

Python - Move item to the end of the list

time.perf_counter () function in Python

Check if one list is a subset of another in Python

Python os.path.join () method