Angenommen, wir haben es mit Daten von einer E-Commerce-Website zu tun. Produktnamen haben nicht das richtige Format. Formatieren Sie die Daten korrekt, sodass keine führenden und abschließenden Leerzeichen vorhanden sind und die Anfangsbuchstaben aller Produkte großgeschrieben werden.
Lösung Nr. 1: In vielen Fällen sind wir mit eine Situation, in der Sie Ihre eigene benutzerdefinierte Funktion schreiben müssen, die für die jeweilige Aufgabe geeignet ist.
# import pandas as pd
import
pandas as pd
# Datenrahmen erstellen
df
=
pd.DataFrame ({
`Datum`
: [
`10/2/2011`
,
` 11/2/2011`
,
`12/2/2011`
,
< Code c lass ="string ">` 13/2/2011` ],
`Produkt`
: [
`UMbreLla`
,
` maTress`
,
`BaDmintoN`
,
`Shuttle `
],
` Updated_Price`
: [
1250
,
1450
,
1550
,
400
],
` Rabatt`
: [
10
,
8
,
15
,
10
]})
# Datenrahmen drucken
print
(df)
Ausgabe:
Jetzt werden wir unsere eigene benutzerdefinierte Funktion schreiben, um dieses Problem zu lösen.
def
Format_data (df):
# über alle Zeilen iterieren
für
i
im
Bereich
(df.shape [
0
]):
# Werte der Produktspalte neu zuweisen
# zuerst die Leerzeichen mit der Funktion strip() entfernen
# dann schreiben wir mit der Funktion capitalize()
df groß. iat [i,
1
]
=
df.iat [i,
1
]. Streifen (). capitalize ( )
# Rufen wir die Funktion auf
Format_data (df )
# Den Datenrahmen drucken
print
(df)
Ausgabe:
Lösung Nr. 2: Jetzt sehen wir einen besseren und effizienteren Ansatz mit dem Pandas Funktion DataFrame.apply ()
.
Ausgabe: Verwenden wir
Ausgabe : ShopLatest questions Wiki |