Stel dat we te maken hebben met gegevens van een e-commercesite. Productnamen zijn niet in het juiste formaat. Formatteer de gegevens correct, zodat er geen voorloop- en volgspaties zijn en de eerste letters van alle producten met een hoofdletter worden geschreven.
Oplossing #1: In veel gevallen worden we geconfronteerd met een situatie waarin we je eigen aangepaste functie moeten schrijven die geschikt is voor de taak die voorhanden is.
# import panda`s als pd
import
panda`s als pd
# Maak een dataframe
df
=
pd.DataFrame ({
`Datum`
: [
`10/2 / 2011`
,
` 11/2 / 2011`
,
`12/2 / 2011`
,
` 13/2 / 2011`
],
`Product`
: [
`UMbreLla`
,
` maTress`
,
`BaDmintoN`
,
`Shuttle `
],
` Updated_Price`
: [
1250
,
1450
,
1550
,
400
],
` Korting`
: [
10
,
8
,
15
,
10
]})
# Druk het dataframe af
print
(df)
Uitvoer:
Nu gaan we onze eigen aangepaste functie schrijven om dit probleem op te lossen.
def
Format_data (df):
# herhaal alle regels
voor
i
in
bereik
(df.shape [
0
]):
# herken waarden ​​aan de productkolom
# verwijder eerst de spaties met de strip () functie
# dan maken we een hoofdletter met de hoofdletterfunctie ()
df. iat [i,
1
]
=
df.iat [i,
1
]. strippen (). hoofdletter ( )
# Laten we de functie
Format_data (df )
# Druk het dataframe af
print
(df)
Uitvoer:
Oplossing #2: Nu zullen we een betere en efficiëntere aanpak zien met behulp van de Panda`s function DataFrame.apply ()
.
Uitvoer: Laten we
Uitvoer : ShopLatest questions Wiki |