用 Embedding 做「相關文章」推薦

2026年3月17日 · 閱讀時間約 2 分鐘

最近幫部落格做了一個「相關文章」功能，用 AI 的語義向量（Embedding）來計算文章之間的相似度。

原文：《DIY 系列：來做個「相關文章」功能》

三個步驟：

方案一：Gemini API（免費）

到 Google AI Studio 申請 API Key，呼叫 gemini-embedding-001 模型。

免費方案有速率限制，我的做法是每篇截取前 2000 字，每隔兩秒呼叫一次。

方案二：BGE-M3 本地端（也免費）

用 Ollama 在本機跑 BGE-M3，CPU 就能跑，完全離線。

ollama pull bge-m3
pip install ollama

import ollama

res = ollama.embeddings(model="bge-m3", prompt="文章內容...")
vector = res["embedding"]

每次重新計算 Embedding 很耗時，所以用 Hash(標題 + 內文) 來判斷文章是否有改變，沒變就直接讀快取。

相似度計算目前是全部重跑（讓新舊文章可以互相連結），一百多篇大概三秒，還可以接受。