資訊內容
Python之自動獲取目標網站最新通知
tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
python之自動獲取目標網站**新通知:tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
1、建立通知數據庫tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
這一步的目的是爬取目標網站已經發布的通知的數據,并進行存儲,從而建立與該目標網站內容相對應的本地數據庫。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
考慮到數據庫中的數據將是辨別和獲取一則新通知的**方法,因此所建立的數據庫將存儲每一條通知的標題、發布日期和訪問鏈接。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
第一步使用到的模塊有urllib、BeautifulSoup和sqlite3模塊。其中,通過urllib模塊爬取目標網頁html數據;通過BeautifulSoup模塊解析網頁數據、爬取網頁內容;通過sqlite3模塊建立目標網站已有通知數據庫。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
該步主要代碼展示如下。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
2、建立郵件發送系統tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
這一步的目的是使用Python標準庫模塊smtplib來訪問網絡,創建一個發送電子郵件的功能。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
由于我們大部分人的計算機并沒有建立自己的郵件服務器,因此需借助第三方服務器來模擬郵件發送。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
常用的有谷歌郵件系統、網易郵件系統和QQ郵件系統,如QQ郵件系統的SMTP服務器和端口號分別為smtp.qq.com和465。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
該步主要代碼展示如下。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
在這個示例中,使用了Python標準庫中的email模塊將電子郵件信息進行了格式化,主要包括郵件的主題與發件人、收件人郵箱昵稱和郵件內容等信息。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
3、解析檢測目標網站通知tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
前面兩步,已經完成了目標網站已有通知數據庫和郵件發送系統的建立,第三步要完成的工作,主要由兩部分組成。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
一是,利用第一步使用的urllib、BeautifulSoup模塊解析目標網站內容數據,并與前面建立的數據庫進行對比檢測。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
二是,若檢測到目標網站有新的通知,則將新通知數據插入到數據庫中,然后,發送提示電子郵件。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
該步主要代碼展示如下。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
在這個示例中,只選取了**新的一條通知發送了電子郵件提示,具體郵件信息可自己設定。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
4、制定計劃任務tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
前面三步,已經完成了使用Python獲取目標網站**新通知,并發送提示電子郵件的腳本程序。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
在這一步,將使用Windows自帶的DOS命令框架和任務計劃程序去每小時自動運行一次Python腳本,實現自動更新通知的目的。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
首先,需要編寫一個cmd命令文件,方便在DOS框架下執行Python腳本。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
主要代碼展示如下:tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
@echo off # 關閉回顯 cd C:demo # 找到Python腳本文件的路徑 python Python.py # 執行Python腳本文件**后,使用任務計劃程序制定一個任務,可設定為每隔一小時自動運行一次cmd命令文件。tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺
更多python進階知識,請觀看Python進階視頻教程!!tvE少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

- 上一篇
用python可以做微信小程序嗎?
簡介其實微信小程序作為一個前端的機制,Python 并不能插上邊。只不過可以作為后端接口為微信小程序提供數據服務而已。python可以做后端服務和小程序通訊,python可以寫后端平臺,提供api,微信小程序就用wx.request()調用這個api。微信小程序主要的三大塊wxml控制頁面結構
- 下一篇
python3爬蟲入門:常用網絡爬蟲模塊和技術
簡介urllib模塊urllib庫是python中自帶的模塊,也是一個最基本的網絡請求庫,該模塊提供了一個urlopen()方法,通過該方法指定URL發送網絡請求來獲取數據。urllib是一個收集了多個涉及URL的模塊的包urllib.request打開和讀取URL三行代碼即可爬取百度首頁源代碼:imp