資訊內容
介紹使用python的statsmodels模塊擬合ARIMA模型

相關免費學習推薦:python視頻教程Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
導入必要包和模塊Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
from scipy import statsimport pandas as pdimport matplotlib.pyplot as pltimport statsmodels.api as smfrom statsmodels.tsa.arima.model import ARIMAfrom statsmodels.graphics.tsaplots import plot_predict plt.rcParams['font.sans-serif']=['simhei']#用于正常顯示中文標簽plt.rcParams['axes.unicode_minus']=False#用于正常顯示負號1.讀取數據并畫圖Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
data=pd.read_csv('數據/客運量.csv',index_col=0)data.index = pd.Index(sm.tsa.datetools.dates_from_range('1949', '2008'))#將時間列改為專門時間格式,方便后期操作data.plot(figsize=(12,8),marker='o',color='black',ylabel='客運量')#畫圖#本文所使用的客流量時間序列數據:https://download.csdn.net/download/weixin_45590329/14143811
#時間序列折線圖如下所示,顯然數據有遞增趨勢,初步判斷數據不平穩Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
2.平穩性檢驗Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
sm.tsa.adfuller(data,regression='c')sm.tsa.adfuller(data,regression='nc')sm.tsa.adfuller(data,regression='ct')進行三種形式的ADF單位根檢驗,如部分結果所示,發現序列不平穩Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
3.對數據作一階差分處理Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
diff=data.diff(1)diff.dropna(inplace=True)diff.plot(figsize=(12,8),marker='o',color='black')#畫圖作出數據一階差分后折線圖,初步判斷平穩Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
4.對一階差分數據進行平穩性檢驗Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
sm.tsa.adfuller(diff,regression='c')sm.tsa.adfuller(diff,regression='nc')sm.tsa.adfuller(diff,regression='ct')如圖所示,說明序列平穩Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
5.確定ARIMA(p,d,q)階數Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
fig = plt.figure(figsize=(12,8))ax1 = fig.add_subplot(211)fig = sm.graphics.tsa.plot_acf(diff.values.squeeze(), lags=12, ax=ax1)#自相關系數圖1階截尾,決定MA(1)ax2 = fig.add_subplot(212)fig = sm.graphics.tsa.plot_pacf(diff, lags=12, ax=ax2)#偏相關系數圖1階截尾,決定AR(1)根據自相關系數圖ACF和偏自相關系數圖PACF,將原始數據確定為ARIMA(1,1,1)模型Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
6.參數估計Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
model = ARIMA(data, order=(1, 1, 1)).fit()#擬合模型model.summary()#統計信息匯總#系數檢驗params=model.params#系數tvalues=model.tvalues#系數t值bse=model.bse#系數標準誤pvalues=model.pvalues#系數p值#繪制殘差序列折線圖resid=model.resid#殘差序列fig = plt.figure(figsize=(12,8))ax = fig.add_subplot(111)ax = model.resid.plot(ax=ax)#計算模型擬合值fit=model.predict(exog=data[['TLHYL']])7.模型檢驗Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
#8.1.檢驗序列自相關sm.stats.durbin_watson(model.resid.values)#DW檢驗:靠近2——正常;靠近0——正自相關;靠近4——負自相關#8.2.AIC和BIC準則model.aic#模型的AIC值model.bic#模型的BIC值#8.3.殘差序列正態性檢驗stats.normaltest(resid)#檢驗序列殘差是否為正態分布#**終檢驗結果顯示無法拒絕原假設,說明殘差序列為正態分布,模型擬合良好#8.4.繪制殘差序列自相關圖和偏自相關圖fig = plt.figure(figsize=(12,8))ax1 = fig.add_subplot(211)fig = sm.graphics.tsa.plot_acf(resid.values.squeeze(), lags=12, ax=ax1)ax2 = fig.add_subplot(212)fig = sm.graphics.tsa.plot_pacf(resid, lags=12, ax=ax2)#如果兩圖都零階截尾,這說明模型擬合良好8.預測Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
#預測至2016年的數據。由于ARIMA模型有兩個參數,至少需要包含兩個初始數據,因此從2006年開始預測predict = model.predict('2006', '2016', dynamic=True)print(predict)#畫預測圖及置信區間圖fig, ax = plt.subplots(figsize=(10,8))fig = plot_predict(model, start='2002', end='2006', ax=ax)legend = ax.legend(loc='upper left')大量免費學習推薦,敬請訪問python教程(視頻)
以上就是介紹使用python的statsmodels模塊擬合ARIMA模型的詳細內容,更多請關注少兒編程網其它相關文章!Jvh少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

- 上一篇
回味Python基本數據類型
簡介免費學習推薦:python視頻教程數據類型是每種編程語言必備屬性,只有給數據賦予明確的數據類型,計算機才能對數據進行處理運算,因此,正確使用數據類型是十分必要的,不同的語言,數據類型類似,但具體表示方法有所不同,以下是Python編程常用的數據類型:常用的數據類型:整數類型int;浮點數類型floa
- 下一篇
python數據分析方向的第三方庫是什么
簡介python數據分析方向的第三方庫是:1、Numpy;2、Pandas;3、SciPy;4、Matplotlib;5、Scikit-Learn;6、Keras;7、Gensim;8、Scrapy。本教程操作環境:windows7系統、Python3版、DellG3電腦。Python是數據處理常用工具