String-Daten im angegebenen Pandas Dataframe löschen

| | | |

Angenommen, wir haben es mit Daten von einer E-Commerce-Website zu tun. Produktnamen haben nicht das richtige Format. Formatieren Sie die Daten korrekt, sodass keine führenden und abschließenden Leerzeichen vorhanden sind und die Anfangsbuchstaben aller Produkte großgeschrieben werden.

Lösung Nr. 1: In vielen Fällen sind wir mit eine Situation, in der Sie Ihre eigene benutzerdefinierte Funktion schreiben müssen, die für die jeweilige Aufgabe geeignet ist.


# import pandas as pd

import pandas as pd


# Datenrahmen erstellen

df = pd.DataFrame ({ `Datum` : [ `10/2/2011` , ` 11/2/2011` , `12/2/2011` , < Code c lass ="string ">` 13/2/2011` ],

`Produkt` : [ `UMbreLla` , ` maTress` , `BaDmintoN` , `Shuttle ` ],

` Updated_Price` : [ 1250 , 1450 , 1550 , 400 ],

` Rabatt` : [ 10 , 8 , 15 , 10 ]})


# Datenrahmen drucken

print (df)

Ausgabe:

Jetzt werden wir unsere eigene benutzerdefinierte Funktion schreiben, um dieses Problem zu lösen.


def Format_data (df):

# über alle Zeilen iterieren

für i im Bereich (df.shape [ 0 ]):


# Werte der Produktspalte neu zuweisen

# zuerst die Leerzeichen mit der Funktion strip() entfernen

# dann schreiben wir mit der Funktion capitalize()

df groß. iat [i, 1 ] = df.iat [i, 1 ]. Streifen (). capitalize ( )


# Rufen wir die Funktion auf
Format_data (df )


# Den Datenrahmen drucken

print (df)

Ausgabe:

Lösung Nr. 2: Jetzt sehen wir einen besseren und effizienteren Ansatz mit dem Pandas Funktion DataFrame.apply () .


# pandas als pd importieren

import Pandas als pd


# Datenrahmen erstellen

df = pd.DataFrame ( {` ` Date` : [ `10/2/2011` , `11/2 / 2011` , `12/2/2011` , ` 13/2/2011` ],

`Produkt` : [ `UMbreLla` , `maTress` , `BaDmintoN` , `Shuttle` ],

`Updated_Price` : [ 1250 , 1450 , 1550 , 400 ],

`Rabatt` : [ 10 , 8 , 15 , 10 ]})


# Drucken der Datenrahmen

print (df)

Ausgabe:

Verwenden wir DataFrame.apply () Pandas DataFrame.apply () , um Produktnamen im gewünschten Format zu formatieren. Innerhalb der Pandas-Funktion DataFrame.apply () verwenden wir eine Lambda-Funktion.


# Mit der df.apply ()-Funktion für ein Spaltenprodukt

df [ `Product` ] = df [ `Produkt ` ]. anwenden ( Lambda x: x.strip (). capitalize ())


# Den Datenrahmen drucken

print (df)

Ausgabe :

Shop

Learn programming in R: courses

$

Best Python online courses for 2022

$

Best laptop for Fortnite

$

Best laptop for Excel

$

Best laptop for Solidworks

$

Best laptop for Roblox

$

Best computer for crypto mining

$

Best laptop for Sims 4

$

Latest questions

NUMPYNUMPY

psycopg2: insert multiple rows with one query

12 answers

NUMPYNUMPY

How to convert Nonetype to int or string?

12 answers

NUMPYNUMPY

How to specify multiple return types using type-hints

12 answers

NUMPYNUMPY

Javascript Error: IPython is not defined in JupyterLab

12 answers


Wiki

Python OpenCV | cv2.putText () method

numpy.arctan2 () in Python

Python | os.path.realpath () method

Python OpenCV | cv2.circle () method

Python OpenCV cv2.cvtColor () method

Python - Move item to the end of the list

time.perf_counter () function in Python

Check if one list is a subset of another in Python

Python os.path.join () method