国产日韩欧美一区二区三区综合,日本黄色免费在线,国产精品麻豆欧美日韩ww,色综合狠狠操

極客小將

您現在的位置是:首頁 » python編程資訊

資訊內容

python 操作 excel 系列之:數據清洗

極客小將2021-03-20-
簡介python在對excel操作的同時,前面文章中說了數據的讀取、插入、簡單分析,還有一個非常重要的點就是數據清洗。那什么叫數據清洗,說白了就是去除數據文本中的垃圾值,比如:存在的空值、多余的空格、數據格式等等的處理。相關免費學習推薦:python視頻教程1,導入python庫、讀取excel數據#導
SnY少兒編程網-https://www.pxcodes.com

python 在對 excel 操作的同時,前面文章中說了數據的讀取、插入、簡單分析,還有一個非常重要的點就是數據清洗。那什么叫數據清洗,說白了就是去除數據文本中的垃圾值,比如:存在的空值、多余的空格、數據格式等等的處理。SnY少兒編程網-https://www.pxcodes.com

相關免費學習推薦:python視頻教程SnY少兒編程網-https://www.pxcodes.com

1,導入 python 庫、讀取 excel 數據# 導入 pandas 庫import pandas as pd# read_excel() 讀取 excel 數據# DataFrame() 將讀取到的數據轉換為 DataFrame 數據df = pd.DataFrame(pd.read_excel('data.xlsx'))2,數據清洗(去除空值)# dropna() 函數去除 df 數據表中存在空值的所有行df.dropna(how='any')# mean() 函數計算 age 字段所在列的平均值age_pre = df['age'].mean()# 使用 fillna() 函數對存在的空值進行填充,將 age_pre 的值填充到字段為空的值內面df['age'].fillna(age_pre)3,數據清洗(清除字段中的空格)# 清除字段的空格df['name'] = df['name'].map(str.strip)4,數據清洗(對某個列進行重命名)# rename() 函數對列進行重命名df.rename(columns={'name': 'name_new'})5,數據清洗(清除某一列中的重復值)# 從前往后查找某個列中的重復值,如果存在則清除后面所出現的重復值df['name'].drop_duplicates()# 從后往前查找某個列中的重復值,如果存在則清除前面所出現的重復值df['city'].drop_duplicates(keep='last')# 兩種正好是按照相反的清除順序6,數據清洗(數據值替換)# 將某一列中的具體值進行替換df['name'].replace('laow', 'lwsbc')

相關免費學習推薦:python教程(視頻)

以上就是python 操作 excel 系列之:數據清洗的詳細內容,更多請關注少兒編程網其它相關文章!SnY少兒編程網-https://www.pxcodes.com

預約試聽課

已有385人預約都是免費的,你也試試吧...

主站蜘蛛池模板: 乌兰浩特市| 马鞍山市| 彭阳县| 无极县| 新竹市| 保定市| 江川县| 临沂市| 昌吉市| 辽源市| 林口县| 竹北市| 黔西县| 含山县| 苍南县| 化州市| 澜沧| 江都市| 体育| 兖州市| 泸州市| 汽车| 邢台县| 蕲春县| 新津县| 瑞丽市| 富源县| 张掖市| 长垣县| 阿拉尔市| 桃园县| 崇明县| 云阳县| 辽宁省| 嘉禾县| 郴州市| 肥乡县| 来凤县| 玉溪市| 沭阳县| 锦屏县|