收集部落格 RSS 網址列表
· 閱讀時間約 2 分鐘
最近「部落格問題挑戰」這個問答挑戰突然很多人響應。
想說可以收集一下大家都答案,就像 Ava 的「bear blog question challenge」一樣!
這樣的話,我就需要收集一下大家的 RSS Feed 了,在這邊記錄一下做法。
雖然都是 AI 在做。
目標
將 BlogBlog Party 頁面上的所有部落格整理成一份可匯入閱讀器的 OPML 清單。
部落格網址列表
- 從 Party 頁面爬取所有連結。
- 去除重複網址,整理並輸出為基礎文字檔。
將網址列表轉成 RSS Feed
- 先比對既有的 OPML(原本就訂閱過的就不用找了)
- 用平台規則猜 RSS 位置,用 cURL 去試試看,平台型部落格通常都會直接成功。
- 抓首頁 HTML,找 link rel="alternate"
- 測試常見路徑(/feed、/rss、/index.xml、/atom.xml...)
- 輸出成
rss_feeds.csv:每個站的 RSS、來源、狀態
這時候大概能收集到九成的 RSS Feed 了,剩下的就手動稍微找一下,很快就處理完了!
最後輸出成 blogblog_party.opml.xml,然後在我的 FreshRSS 閱讀器開一個帳號,把這份清單匯入進去。
之後只要上去搜尋關鍵字「部落格問題挑戰」就可以了!