跳至主要内容

收集部落格 RSS 網址列表

· 閱讀時間約 2 分鐘

最近「部落格問題挑戰」這個問答挑戰突然很多人響應。

想說可以收集一下大家都答案,就像 Ava 的「bear blog question challenge」一樣!

這樣的話,我就需要收集一下大家的 RSS Feed 了,在這邊記錄一下做法。

雖然都是 AI 在做。

目標

BlogBlog Party 頁面上的所有部落格整理成一份可匯入閱讀器的 OPML 清單

部落格網址列表

  1. 從 Party 頁面爬取所有連結。
  2. 去除重複網址,整理並輸出為基礎文字檔。

將網址列表轉成 RSS Feed

  1. 先比對既有的 OPML(原本就訂閱過的就不用找了)
  2. 用平台規則猜 RSS 位置,用 cURL 去試試看,平台型部落格通常都會直接成功。
  3. 抓首頁 HTML,找 link rel="alternate"
  4. 測試常見路徑(/feed、/rss、/index.xml、/atom.xml...)
  5. 輸出成 rss_feeds.csv:每個站的 RSS、來源、狀態

這時候大概能收集到九成的 RSS Feed 了,剩下的就手動稍微找一下,很快就處理完了!

最後輸出成 blogblog_party.opml.xml,然後在我的 FreshRSS 閱讀器開一個帳號,把這份清單匯入進去。

之後只要上去搜尋關鍵字「部落格問題挑戰」就可以了!