清除指定 Pandas 數據框中的字符串數據

| | | |

假設我們正在處理來自電子商務網站的數據。產品名稱的格式不正確。正確格式化數據,使前後沒有空格,並且所有產品的首字母大寫。

解決方案#1:很多情況下,我們面臨我們需要編寫適合手頭任務的自定義函數的情況。


# import pandas as pd

import pandas as pd


# 創建數據框

df = pd.DataFrame ({ `Date` : [ `10/2 / 2011` , `11/2 / 2011` , `12/2 / 2011` , <代碼 c lass ="string ">` 13/2 / 2011` ],

`Product` : [ `UMbreLla` , `maTress` , `BaDmintoN` , `Shuttle` ],

` Updated_Price` : [ 1250 , 1450 , 1550 , 400 ],

`折扣` : [ 10 , 8 , 15 , 10 ]})


# 打印數據框

print (df)

輸出:

現在我們將自己編寫一個自定義函數來解決這個問題。


def Format_data (df):

# 遍歷所有行

for i in range (df.shape [ 0 ]):


# 重新賦值 ‚Äã‚Äã 到產品列

# 首先使用 strip() 函數刪除空格

# 然後我們用 capitalize() 函數大寫

df. iat [i, 1 ] = df.iat [i, 1 ]。條 ()。 capitalize ( )


# 我們去調用函數
Format_data (df )


# 打印數據框

print (df)

輸出:

解決方案 #2: 現在我們將看到使用 Pandas function DataFrame.apply () .


# import pandas as pd

import pandas as pd


# 創建數據框

df = pd.DataFrame ({` `Date` : [ `10/2 / 2011` , `11/2 / 2011` , `12/2 / 2011` , ` 13/2 / 2011` ],

`Product` : [ `UMbreLla` , `maTress` , `BaDmintoN` , `Shuttle` ],

`Updated_Price` : [ 1250 , 1450 , 1550 , 400 ],

`折扣` : [ 10 , 8 , 15 , 10 ]})


#打印數據框

print (df)

輸出:

讓我們使用 DataFrame.apply () Pandas DataFrame.apply () 將產品名稱格式化為所需的格式。在 Pandas DataFrame.apply () 函數內部,我們將使用 lambda 函數。


# 使用df.apply() 函數對列 product

df [ `Product` ] = df [ `產品` ]。 apply ( lambda x: x.strip ().capitalize ())


# 打印Dataframe

print (df)

輸出:

Shop

Learn programming in R: courses

$

Best Python online courses for 2022

$

Best laptop for Fortnite

$

Best laptop for Excel

$

Best laptop for Solidworks

$

Best laptop for Roblox

$

Best computer for crypto mining

$

Best laptop for Sims 4

$

Latest questions

NUMPYNUMPY

psycopg2: insert multiple rows with one query

12 answers

NUMPYNUMPY

How to convert Nonetype to int or string?

12 answers

NUMPYNUMPY

How to specify multiple return types using type-hints

12 answers

NUMPYNUMPY

Javascript Error: IPython is not defined in JupyterLab

12 answers


Wiki

Python OpenCV | cv2.putText () method

numpy.arctan2 () in Python

Python | os.path.realpath () method

Python OpenCV | cv2.circle () method

Python OpenCV cv2.cvtColor () method

Python - Move item to the end of the list

time.perf_counter () function in Python

Check if one list is a subset of another in Python

Python os.path.join () method