PTT爬蟲系列文之MARVEL篇,將鬼怪討論串的內容,將討論度高的文章結錄存至本機電腦記事本中。

引用python套件

  • BeautifulSoup
    用於解析html DOM
    pip3 install beautifulsoup4
  • requests
    用於對網址發出http requests
    pip3 install requests

程式碼

  • 架構
  • 程式碼解析
  • Demo

架構

程式碼解析

Function解析

– def parsePage(pageURL)

– def findNextPageURL(HTMLdata)

– def findAllTitle(HTMLdata)

– def loadArticle(data)

– def fixFilePath(oriPath)

Demo

資料夾內容
marvel_result

txt內容
marvel_result_txt

最後修改日期: 2021-04-01

留言

撰寫回覆或留言

發佈留言必須填寫的電子郵件地址不會公開。