您現在的位置是：首頁 » python編程資訊

資訊內容

介紹python60行代碼寫一個簡單的筆趣閣爬蟲

極客小將2021-01-16-

簡介推薦（免費）：Python視頻教程文章目錄系列文章目錄前言一、網頁解析二、代碼填寫1.獲取Html及寫入方法2.其余代碼總結前言利用python寫一個簡單的筆趣閣爬蟲，根據輸入的小說網址爬取整個小說并保存到txt文件。爬蟲用到了BeautifulSoup庫的select方法結果如圖所示：本文只用于學

j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

推薦（免費）：python視頻教程j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

文章目錄j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

系列文章目錄前言一、網頁解析二、代碼填寫1.獲取Html及寫入方法2.其余代碼總結

前言j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

利用python寫一個簡單的筆趣閣爬蟲，根據輸入的小說網址爬取整個小說并保存到txt文件。爬蟲用到了BeautifulSoup庫的select方法
結果如圖所示：

本文只用于學習爬蟲j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

一、網頁解析j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

這里以斗羅大陸小說為例網址：
http://www.biquge001.com/Book/2/2486/

可以發現每章的網頁地址和章節名都放在了 <"p id=list dl dd a>中的a標簽中，所以利用BeautfulSoup中的select方法可以得到網址和章節名j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

Tag = BeautifulSoup(getHtmlText(url), "html.parser") #這里的getHtmlText是自己寫的獲取html的方法urls = Tag.select("p #list dl dd a")

然后遍歷列表j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

for url in urls: href = "http://www.biquge001.com/" + url['href'] # 字符串的拼接拼接成正確的網址 pageName = url.text # 每章的章名

然后每章小說的內容都存放在<p id=“content” 里同理得
j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

substance = Tag.select("p #content") # 文章的內容

**后同理在首頁獲取小說的名稱
<"p id = info h1>j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

bookName = Tag.select("p #info h1")

j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

二、代碼填寫j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

1.獲取Html及寫入方法j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

def getHtmlText(url): r = requests.get(url, headers=headers) r.encoding = r.apparent_encoding # 編碼轉換 r.raise_for_status() return r.textdef writeIntoTxt(filename, content): with open(filename, "w", encoding="utf-8") as f: f.write(content) f.close() print(filename + "已完成")

2.其余代碼j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

代碼如下（示例）：j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

url = "http://www.biquge001.com/Book/2/2486/"substanceStr = ""bookName1 = ""html = getHtmlText(url)# 判斷是否存在這個文件Tag = BeautifulSoup(getHtmlText(url), "html.parser")urls = Tag.select("p #list dl dd a")bookName = Tag.select("p #info h1")for i in bookName: bookName1 = i.textif not os.path.exists(bookName1): os.mkdir(bookName1) print(bookName1 + "創建完成")else: print("文件已創建")for url in urls: href = "http://www.biquge001.com/" + url['href'] # 字符串的拼接拼接成正確的網址 pageName = url.text # 每章的章名 path = bookName1 + "\" # 路徑 fileName = path + url.text + ".txt" # 文件名 = 路徑 + 章節名 + ".txt" Tag = BeautifulSoup(getHtmlText(href), "html.parser") # 解析每張的網頁 substance = Tag.select("p #content") # 文章的內容 for i in substance: substanceStr = i.text writeIntoTxt(fileName, substanceStr) time.sleep(1)

j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

總結j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

簡單利用了BeautfulSoup的select方法對筆趣閣的網頁進行了爬取 j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

更多相關學習敬請關注python教程欄目！

以上就是介紹python60行代碼寫一個簡單的筆趣閣爬蟲的詳細內容，更多請關注少兒編程網其它相關文章！j27少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

上一篇
Python數據分析實戰之概述數據分析

簡介Python教程欄目介紹概述數據。推薦（免費）：Python教程文章目錄一、入門數據分析1.大數據時代的基本面2.數據分析師職業前景3.成為數據分析師之路二、Python的安裝與環境配置1.Python版本2.不同系統安裝Python3.環境變量配置4.安裝pip5.集成開發環境選擇三、Anacon

下一篇
Python培訓機構靠譜嗎？Python培訓機構怎么選？

簡介近幾年，網絡浪潮涌起，而Python市場一直是人才稀缺。Python語言簡單易學，就業前景廣自然也獲得了年輕人的青睞。Python培訓機構靠譜嗎？Python培訓機構怎么選？是每位學習者的糾結點，那么一個合格的Python培訓機構是什么樣子的呢？跟隨小編篩一篩。一、培訓機構地理位置就拿北京來說，哪個

相關資訊

預約試聽課

已有385人預約都是免費的，你也試試吧...

精品課程

Scratch自學精品課程(45節課)目...

官方教程 10、錄制聲音

官方教程 9、制作音樂

官方教程 8、創作故事

官方教程 7、角色動畫

推薦下載

Scratch 3.29.1 Windows版 Mac...

Scratch 3.26.0 Setup Windows...

Scratch 3.26 Mac版本官方下載...

scratchlink 下載

Scratch 3.23.1 Mac版本官方下...

Scratch 3.23.1 Setup Windows...

Scratch 3.22.0 Mac版本官方下...

Scratch 3.22.0 Setup Windows...

標簽云

Scratch(112) python(56) 少兒編程(44) 藍橋杯(32) 小升初(20) Scratch教材(19) 清華大學出版社(19) 電子學會(17) 等級考試(15) scratch作品(13) 真題(11) 數學(10) 人工智能(10) 算法(9) scratch等級(9) 四級考試(9) 三級考試(9) 電子協會(9) Scratch下載(9) 字典(6)

猜你喜歡

認識Scratch的舞臺

Scratch電子學會等級考試時間和...

Scratch考試將會在近期進行全面...

Scratch編程：培養孩子創新思維...

學Scratch編程的費用一般是多少

Scratch教程：進階課程-打地鼠

Scratch教程：進階課程-打蝙蝠...

scratch教程判斷 if then

Scratch計算三角形面積

Scratch會飛的巫婆

Scratch迷宮游戲設計

国产日韩欧美一区二区三区综合,日本黄色免费在线,国产精品麻豆欧美日韩ww,色综合狠狠操

資訊內容

介紹python60行代碼寫一個簡單的筆趣閣爬蟲

Python數據分析實戰之 概述數據分析

Python培訓機構靠譜嗎？Python培訓機構怎么選？

相關資訊

預約試聽課

Python數據分析實戰之概述數據分析