Załóżmy, że mamy do czynienia z danymi z witryny e-commerce. Nazwy produktów mają niepoprawny format. Prawidłowo sformatuj dane, tak aby nie było spacji wiodących i końcowych, a pierwsze litery wszystkich produktów były pisane wielkimi literami.
Rozwiązanie nr 1: W wielu przypadkach mamy do czynienia z sytuacja, w której musimy napisać własną niestandardową funkcję odpowiednią do wykonywanego zadania.
# importuj pandy jako pd
importuj
pandy jako pd
# Utwórz ramkę danych
df
=
pd.DataFrame ({
`Data`
: [
`10/2/2011`
,
` 11/2/2011`
,
`12/2/2011`
,
< kod c lass ="string ">` 13.02.2011` ],
`Produkt`
: [
`UMbreLla`
,
` maTress`
,
`BaDmintoN`
,
`Shuttle `
],
` Updated_Price`
: [
1250
,
1450
1550
,
400
],
` Rabat`
: [
10
,
8
,
15
,
10
]})
# Wydrukuj ramkę danych
print
(df)
Wyjście:
Teraz napiszemy własną niestandardową funkcję, aby rozwiązać ten problem.
def
Format_data (df):
# iteruj po wszystkich wierszach
for
in
zakres
(df.shape [
0
]):
# ponownie przypisz wartości do kolumny produktu
# najpierw usuń spacje za pomocą funkcji strip()
# wtedy kapitalizujemy funkcją capitalize()
df. iat [i,
1
]
=
df.iat [i,
1
]. rozebrać się (). capitalize ( )
# Przejdźmy do wywołania funkcji
Format_data (df )
# Wydrukuj Dataframe
drukuj
(df)
Wyjście:
Rozwiązanie nr 2: Teraz zobaczymy lepsze i wydajniejsze podejście przy użyciu function DataFrame.apply ()
.
Wyjście: Użyjmy
Wyjście : ShopLatest questions Wiki |