Tekenreeksgegevens wissen in gespecificeerd Pandas-dataframe

| | | |

Stel dat we te maken hebben met gegevens van een e-commercesite. Productnamen zijn niet in het juiste formaat. Formatteer de gegevens correct, zodat er geen voorloop- en volgspaties zijn en de eerste letters van alle producten met een hoofdletter worden geschreven.

Oplossing #1: In veel gevallen worden we geconfronteerd met een situatie waarin we je eigen aangepaste functie moeten schrijven die geschikt is voor de taak die voorhanden is.


# import panda`s als pd

import panda`s als pd


# Maak een dataframe

df = pd.DataFrame ({ `Datum` : [ `10/2 / 2011` , ` 11/2 / 2011` , `12/2 / 2011` , ` 13/2 / 2011` ],

`Product` : [ `UMbreLla` , ` maTress` , `BaDmintoN` , `Shuttle ` ],

` Updated_Price` : [ 1250 , 1450 , 1550 , 400 ],

` Korting` : [ 10 , 8 , 15 , 10 ]})


# Druk het dataframe af

print (df)

Uitvoer:

Nu gaan we onze eigen aangepaste functie schrijven om dit probleem op te lossen.


def Format_data (df):

# herhaal alle regels

voor i in bereik (df.shape [ 0 ]):


# herken waarden ‚Äã‚Äãaan de productkolom

# verwijder eerst de spaties met de strip () functie

# dan maken we een hoofdletter met de hoofdletterfunctie ()

df. iat [i, 1 ] = df.iat [i, 1 ]. strippen (). hoofdletter ( )


# Laten we de functie
Format_data (df )


# Druk het dataframe af

print (df)

Uitvoer:

Oplossing #2: Nu zullen we een betere en efficiëntere aanpak zien met behulp van de Panda`s function DataFrame.apply () .


# import panda`s als pd

import panda`s als pd


# Creëer dataframe

df = pd.DataFrame ( {` ` Date` : [ `10/2 / 2011` , `11/2 / 2011` , `12/2 / 2011` , ` 13/2 / 2011` ],

`Product` : [ `UMbreLla` , ` maTress` , `BaDmintoN` , `Shuttle` ],

`Updated_Price` : [ 1250 , 1450 , 1550 , 400 ],

`Korting` : [ 10 , 8 , 15 , 10 ]})


# Afdrukken het dataframe

print (df)

Uitvoer:

Laten we DataFrame.apply () Panda`s DataFrame.apply () gebruiken om productnamen in het gewenste formaat op te maken. Binnen de Pandas DataFrame.apply () -functie gebruiken we een lambda-functie.


# Met behulp van de df.apply () functie op een kolomproduct

df [ `Product` ] = df [ `Product ` ]. toepassen ( lambda x: x.strip (). hoofdletter ())


# Druk het dataframe af

print (df)

Uitvoer :
< / p>

Shop

Learn programming in R: courses

$

Best Python online courses for 2022

$

Best laptop for Fortnite

$

Best laptop for Excel

$

Best laptop for Solidworks

$

Best laptop for Roblox

$

Best computer for crypto mining

$

Best laptop for Sims 4

$

Latest questions

NUMPYNUMPY

psycopg2: insert multiple rows with one query

12 answers

NUMPYNUMPY

How to convert Nonetype to int or string?

12 answers

NUMPYNUMPY

How to specify multiple return types using type-hints

12 answers

NUMPYNUMPY

Javascript Error: IPython is not defined in JupyterLab

12 answers


Wiki

Python OpenCV | cv2.putText () method

numpy.arctan2 () in Python

Python | os.path.realpath () method

Python OpenCV | cv2.circle () method

Python OpenCV cv2.cvtColor () method

Python - Move item to the end of the list

time.perf_counter () function in Python

Check if one list is a subset of another in Python

Python os.path.join () method