資訊內容
Python如何畫P-R曲線
CUA少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
python如何畫P-R曲線CUA少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
Python生成P-R圖需要安裝第三方庫matplotlib、numpy及sklearn。CUA少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
推薦學習《python教程》。CUA少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
P-R曲線的生成方法:CUA少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
根據學習器的預測結果對樣本進行排序,排在前面的是學習器認為**可能是正例的樣本,排在**后的是**不可能是正例的樣本,按此順序逐個將樣本作為正例預測,則每次可以計算出當前的查全率、查準率,以查全率為橫軸、查準率為縱軸做圖,得到的查準率-查全率曲線即為P-R曲線。CUA少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
也就是說對每個樣本預測其為正例的概率,然后將所有樣本按預測的概率進行排序,然后依次將排序后的樣本做為正例進行預測,從而得到每次預測的查全率與查準率。這個依次將樣本做為正例的過程實際上就是逐步降低樣本為正例的概率的域值,通過降低域值,更多的樣本會被預測為正例,從而會提高查全率,相對的查準率可能降低,而隨著后面負樣本的增加,查全率提高緩慢甚至沒有提升,精度降低會更快。CUA少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
sklearn的計算過程與定義相反是按概率從小到大遞增的順序來計算查準率與查全率的,并且分別為查準率和查全率添加了1和0。CUA少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
#coding:utf-8 import matplotlib import numpy as np import matplotlib.pyplot as plt from sklearn.metrics import precision_recall_curve from sklearn.utils.fixes import signature plt.figure("P-R Curve") plt.title('Precision/Recall Curve') plt.xlabel('Recall') plt.ylabel('Precision') #y_true為樣本實際的類別,y_scores為樣本為正例的概率 y_true = np.array([1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0]) y_scores = np.array([0.9, 0.75, 0.86, 0.47, 0.55, 0.56, 0.74, 0.62, 0.5, 0.86, 0.8, 0.47, 0.44, 0.67, 0.43, 0.4, 0.52, 0.4, 0.35, 0.1]) precision, recall, thresholds = precision_recall_curve(y_true, y_scores) #print(precision) #print(recall) #print(thresholds) plt.plot(recall,precision) plt.show()CUA少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
