您現在的位置是：首頁 » python編程資訊

資訊內容

看看pyhton的sklearn機器學習算法

極客小將2021-02-19-

簡介免費學習推薦：python視頻教程導入必要通用模塊importpandasaspdimportmatplotlib.pyplotaspltimportosimportnumpyasnpimportcopyimportreimportmath一機器學習通用框架：以knn為例#利用鄰近點方式訓練數據不太

h3L少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

免費學習推薦：python視頻教程h3L少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

導入必要通用模塊h3L少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

import pandas as pdimport matplotlib.pyplot as pltimport osimport numpy as npimport copyimport reimport math

一機器學習通用框架：以knn為例h3L少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

#利用鄰近點方式訓練數據不太適用于高維數據from sklearn.model_selection import train_test_split#將數據分為測試集和訓練集from sklearn.neighbors import KNeighborsClassifier#利用鄰近點方式訓練數據#1.讀取數據data=pd.read_excel('數據/樣本數據.xlsx')#2.將數據標準化from sklearn import preprocessingfor col in data.columns[2:]:#為了不破壞數據集中的離散變量，只將數值種類數高于10的連續變量標準化 if len(set(data[col]))>10: data[col]=preprocessing.scale(data[col])#3.構造自變量和因變量并劃分為訓練集和測試集X=data[['month_income','education_outcome','relationship_outcome', 'entertainment_outcome','traffic_', 'express', 'express_distance','satisfac', 'wifi_neghbor','wifi_relative', 'wifi_frend', 'internet']]y=data['wifi']X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3)#利用train_test_split進行將訓練集和測試集進行分開，test_size占30%#4.模型擬合model=KNeighborsClassifier()#引入訓練方法model.fit(X_train,y_train)#進行填充測試數據進行訓練y_predict=model.predict(X_test)#利用測試集數據作出預測#通過修改判別概率標準修改預測結果proba=model.predict_proba(X_test)#返回基于各個測試集樣本所預測的結果為0和為1的概率值#5.模型評價#(1)測試集樣本數據擬合優度，model.score(X,y)model.score(X_test,y_test)#(2)構建混淆矩陣，判斷預測精準程度""" 混淆矩陣中行代表真實值，列代表預測值 TN:實際為0預測為0的個數 FP:實際為0預測為1的個數 FN:實際為1預測為0的個數 TP:實際為1預測為1的個數精準率precision=TP/(TP+FP)——被預測為1的樣本的的預測正確率召回率recall=TP/(TP+FN)——實際為1的樣本的正確預測率 """from sklearn.metrics import confusion_matrix cfm=confusion_matrix(y_test, y_predict)plt.matshow(cfm,cmap=plt.cm.gray)#cmap參數為繪制矩陣的顏色集合，這里使用灰度plt.show()#(3)精準率和召回率from sklearn.metrics import precision_score,recall_score precision_score(y_test, y_predict)# 精準率recall_score(y_test, y_predict)#召回率#(4)錯誤率矩陣row_sums = np.sum(cfm,axis=1)err_matrix = cfm/row_sums np.fill_diagonal(err_matrix,0)#對err_matrix矩陣的對角線置0，因為這是預測正確的部分，不關心plt.matshow(err_matrix,cmap=plt.cm.gray)#亮度越高的地方代表錯誤率越高plt.show()

二數據處理h3L少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

#1.構造數據集from sklearn import datasets#引入數據集#n_samples為生成樣本的數量，n_features為X中自變量的個數，n_targets為y中因變量的個數，bias表示使線性模型發生偏差的程度，X,y=datasets.make_regression(n_samples=100,n_features=1,n_targets=1,noise=1,bias=0.5,tail_strength=0.1)plt.figure(figsize=(12,12))plt.scatter(X,y)#2.讀取數據data=pd.read_excel('數據/樣本數據.xlsx')#3.將數據標準化——preprocessing.scale（data）from sklearn import preprocessing#為了不破壞數據集中的離散變量，只將數值種類數高于10的連續變量標準化for col in data.columns[2:]: if len(set(data[col]))>10: data[col]=preprocessing.scale(data[col])

三回歸h3L少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

1.普通**小二乘線性回歸h3L少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

import numpy as npfrom sklearn.linear_model import LinearRegressionfrom sklearn.model_selection import train_test_split X=data[['work', 'work_time', 'work_salary', 'work_address', 'worker_number', 'month_income', 'total_area', 'own_area', 'rend_area', 'out_area', 'agricultal_income', 'things', 'wifi', 'internet_fee', 'cloth_outcome', 'education_outcome', 'medcine_outcome', 'person_medicne_outcome', 'relationship_outcome', 'food_outcome', 'entertainment_outcome', 'agriculta_outcome', 'other_outcome', 'owe', 'owe_total', 'debt', 'debt_way', 'distance_debt', 'distance_market', 'traffic_', 'express', 'express_distance', 'exercise', 'satisfac', 'wifi_neghbor', 'wifi_relative', 'wifi_frend', 'internet', 'medical_insurance']]y=data['total_income']model=LinearRegression().fit(X,y)#擬合模型model.score(X,y)#擬合優度model.coef_#查看擬合系數model.intercept_#查看擬合截距項model.predict(np.array(X.ix[25,:]).reshape(1,-1))#預測model.get_params()#得到模型的參數

2.邏輯回歸Logith3L少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

from sklearn.linear_model import LogisticRegression#2.1數據處理X=data[['month_income', 'education_outcome','relationship_outcome', 'entertainment_outcome','traffic_', 'express', 'express_distance','satisfac', 'wifi_neghbor','wifi_relative', 'wifi_frend', 'internet']]y=data['wifi']X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3)#利用train_test_split進行將訓練集和測試集進行分開，test_size占30%#2.2模型擬合model = LogisticRegression()model.fit(X_train,y_train)model.score(X_test,y_test)#2.3模型預測y_predict = model.predict(X_test)#2.4通過調整判別分數標準，來調整判別結果decsion_scores = model.decision_function(X_test)#用于決定預測值取值的判別分數y_predict = decsion_scores>=5.0#將判別分數標準調整為5#2.5通過精準率——召回率曲線圖尋找**優判別標準#由于隨著判別標準的變化，精確率和召回率此消彼長，因此需要尋找一個**佳的判別標準使得精準率和召回率盡可能大from sklearn.metrics import precision_recall_curve precisions,recalls,thresholds = precision_recall_curve(y_test,decsion_scores)#thresholds表示所有可能得判別標準，即判別分數**大與**小值之間的范圍#由于precisions和recalls中比thresholds多了一個元素，因此要繪制曲線，先去掉這個元素plt.plot(thresholds,precisions[:-1])plt.plot(thresholds,recalls[:-1])plt.show()y_predict = decsion_scores>=2#根據上圖顯示，兩線交于-0.3處，因此將判別分數標準調整為-0.3#2.6繪制ROC曲線:用于描述TPR和FPR之間的關系，ROC曲線圍成的面積越大，說明模型越好"""TPR即是召回率_越大越好，FPR=(FP)/(TN+FP)_越小越好"""from sklearn.metrics import roc_curve fprs,tprs,thresholds = roc_curve(y_test,decsion_scores)plt.plot(fprs,tprs)plt.show()#2.7繪制混淆矩陣from sklearn.metrics import confusion_matrix,precision_score,recall_score cfm =confusion_matrix(y_test, y_predict)# 構建混淆矩陣并繪制混淆矩陣熱力圖plt.matshow(cfm,cmap=plt.cm.gray)#cmap參數為繪制矩陣的顏色集合，這里使用灰度plt.show()precision_score(y_test, y_predict)# 精準率recall_score(y_test, y_predict)#召回率

四模型評價h3L少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

#1.混淆矩陣，精準率和召回率from sklearn.metrics import confusion_matrix,precision_score,recall_score""" 混淆矩陣中行代表真實值，列代表預測值 TN:實際為0預測為0的個數 FP:實際為0預測為1的個數 FN:實際為1預測為0的個數 TP:實際為1預測為1的個數精準率precision=TP/(TP+FP)——被預測為1的樣本的的預測正確率召回率recall=TP/(TP+FN)——實際為1的樣本的正確預測率 """cfm =confusion_matrix(y_test, y_predict)# 構建混淆矩陣并繪制混淆矩陣熱力圖plt.matshow(cfm,cmap=plt.cm.gray)#cmap參數為繪制矩陣的顏色集合，這里使用灰度plt.show()precision_score(y_test, y_predict)# 精準率recall_score(y_test, y_predict)#召回率#2.精準率和召回率作圖:由于精準率和召回率此消彼長，應當選擇適當的參數使二者同時盡可能的大#3.調和平均值"""精準率和召回率的調和平均值"""from sklearn.metrics import f1_score f1_score(y_test,y_predict)#4.錯誤率矩陣row_sums = np.sum(cfm,axis=1)err_matrix = cfm/row_sums np.fill_diagonal(err_matrix,0)#對err_matrix矩陣的對角線置0，因為這是預測正確的部分，不關心plt.matshow(err_matrix,cmap=plt.cm.gray)#亮度越高的地方代表錯誤率越高plt.show()

相關免費學習推薦：python教程（視頻）h3L少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

以上就是看看pyhton的sklearn機器學習算法的詳細內容，更多請關注少兒編程網其它相關文章！h3L少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

上一篇
python對文件操作采用的統一步驟是什么

簡介python對文件操作采用的統一步驟是：“打開—操作—關閉”。“打開—操作—關閉”是一個統一步驟，其中，“關閉”可以省略。python可以使用os模塊和shutil模塊中的方法對文件、文件夾進行操作。本教程操作環境：windows7系統、Python3版、DellG3電腦。Python對文件操作采用

下一篇
介紹Python中openpyxl模塊基本用法

簡介免費學習推薦：python視頻教程在接口自動化測試中，對于測試數據通常采用Excel進行管理。Openpyxl能夠讀取和修改.xls文件，使用Openpyxl前先要掌握三個對象，即：Workbook(工作簿，一個包含多個Sheet的Excel文件)、Worksheet（工作表，一個Workbook有

相關資訊

預約試聽課

已有385人預約都是免費的，你也試試吧...

精品課程

Scratch自學精品課程(45節課)目...

官方教程 10、錄制聲音

官方教程 9、制作音樂

官方教程 8、創作故事

官方教程 7、角色動畫

推薦下載

Scratch 3.29.1 Windows版 Mac...

Scratch 3.26.0 Setup Windows...

Scratch 3.26 Mac版本官方下載...

scratchlink 下載

Scratch 3.23.1 Mac版本官方下...

Scratch 3.23.1 Setup Windows...

Scratch 3.22.0 Mac版本官方下...

Scratch 3.22.0 Setup Windows...

標簽云

Scratch(112) python(56) 少兒編程(44) 藍橋杯(32) 小升初(20) Scratch教材(19) 清華大學出版社(19) 電子學會(17) 等級考試(15) scratch作品(13) 真題(11) 數學(10) 人工智能(10) 算法(9) scratch等級(9) 四級考試(9) 三級考試(9) 電子協會(9) Scratch下載(9) 字典(6)

猜你喜歡

認識Scratch的舞臺

Scratch電子學會等級考試時間和...

Scratch考試將會在近期進行全面...

Scratch編程：培養孩子創新思維...

學Scratch編程的費用一般是多少

Scratch教程：進階課程-打地鼠

Scratch教程：進階課程-打蝙蝠...

scratch教程判斷 if then

Scratch計算三角形面積

Scratch會飛的巫婆

Scratch迷宮游戲設計

国产日韩欧美一区二区三区综合,日本黄色免费在线,国产精品麻豆欧美日韩ww,色综合狠狠操

資訊內容

看看pyhton的sklearn機器學習算法

python對文件操作采用的統一步驟是什么

介紹Python中openpyxl模塊基本用法

相關資訊

預約試聽課