您現在的位置是:首頁 » python編程資訊
資訊內容
python 操作 excel 系列之:數據清洗
極客小將2021-03-20-
簡介python在對excel操作的同時,前面文章中說了數據的讀取、插入、簡單分析,還有一個非常重要的點就是數據清洗。那什么叫數據清洗,說白了就是去除數據文本中的垃圾值,比如:存在的空值、多余的空格、數據格式等等的處理。相關免費學習推薦:python視頻教程1,導入python庫、讀取excel數據#導

python 在對 excel 操作的同時,前面文章中說了數據的讀取、插入、簡單分析,還有一個非常重要的點就是數據清洗。那什么叫數據清洗,說白了就是去除數據文本中的垃圾值,比如:存在的空值、多余的空格、數據格式等等的處理。SnY少兒編程網-https://www.pxcodes.com
相關免費學習推薦:python視頻教程SnY少兒編程網-https://www.pxcodes.com
1,導入 python 庫、讀取 excel 數據# 導入 pandas 庫import pandas as pd# read_excel() 讀取 excel 數據# DataFrame() 將讀取到的數據轉換為 DataFrame 數據df = pd.DataFrame(pd.read_excel('data.xlsx'))2,數據清洗(去除空值)# dropna() 函數去除 df 數據表中存在空值的所有行df.dropna(how='any')# mean() 函數計算 age 字段所在列的平均值age_pre = df['age'].mean()# 使用 fillna() 函數對存在的空值進行填充,將 age_pre 的值填充到字段為空的值內面df['age'].fillna(age_pre)3,數據清洗(清除字段中的空格)# 清除字段的空格df['name'] = df['name'].map(str.strip)4,數據清洗(對某個列進行重命名)# rename() 函數對列進行重命名df.rename(columns={'name': 'name_new'})5,數據清洗(清除某一列中的重復值)# 從前往后查找某個列中的重復值,如果存在則清除后面所出現的重復值df['name'].drop_duplicates()# 從后往前查找某個列中的重復值,如果存在則清除前面所出現的重復值df['city'].drop_duplicates(keep='last')# 兩種正好是按照相反的清除順序6,數據清洗(數據值替換)# 將某一列中的具體值進行替換df['name'].replace('laow', 'lwsbc')相關免費學習推薦:python教程(視頻)
以上就是python 操作 excel 系列之:數據清洗的詳細內容,更多請關注少兒編程網其它相關文章!SnY少兒編程網-https://www.pxcodes.com

- 上一篇
學習Python解決高等數學問題
簡介Python解決高等數學問題,媽媽再也不用擔心我的學習使用Python解決高等數學中極限、導數、偏導數、定積分、不定積分、雙重積分等問題Sympy是一個Python的科學計算庫,它旨在成為功能齊全的計算機代數系統。SymPy包括從基本符號算術到微積分,代數,離散數學和量子物理學的功能。它可以在LaT
- 下一篇
python怎么判斷是否為字符串
簡介在python中可以使用isinstance()函數來判斷是否為字符串,語法格式“isinstance(object,basestring)”;isinstance()函數是用于判斷一個對象是否是一個已知的類型。本教程操作環境:windows7系統、python3版,DELLG3電腦python判斷