跳轉到

n8n RAG 與 Voice Agent 補充教材

這份筆記整理自 260411_素養班_Day5.pdf 中與 RAG、Voice Agent、Voice RAG Agent 相關的內容,目的是把你從一般 AI workflow 再往知識檢索與語音互動推進一步。

想一想

RAG 的直覺很簡單:不要只叫 AI 憑印象回答,而是先幫它找到相關資料,再讓它根據資料回答。這就像你問同事一個公司制度問題,如果他只是憑記憶回答,可能會錯;如果他先查最新 SOP,再整理給你,可信度就比較高。RAG 的價值不在於讓模型變神,而是讓回答更貼近你提供的文件。

Voice Agent 也是同樣邏輯,只是入口變成語音。語音本身不是重點,重點是語音轉成文字後,後面仍然要走資料整理、判斷、查詢、輸出這些步驟。新手不要一開始就做完整語音助理,可以先做文字版 RAG,確認資料能被正確檢索,再加語音輸入或語音輸出。這樣你會清楚知道問題出在語音辨識、文件檢索、prompt,還是輸出格式。

本篇怎麼讀

  • 學習目標:理解 RAG、Voice Agent、Voice RAG Agent 在 n8n 中的結構
  • 先修需求:已看過 07 n8n + OpenAI 實作範例集08 n8n Agent 基礎補充教材
  • 讀完後你應該能:解釋 RAG 的流程、知道 Voice Agent 多了哪些步驟、理解這些概念怎麼應用到不同語音或知識檢索案例

1. RAG 是什麼

RAG 的核心不是「更聰明」,而是: - 先找資料 - 再回答

基本流程是: 1. 使用者提問 2. 系統先檢索相關內容 3. 把相關內容交給模型 4. 模型根據資料生成回答

這和直接問模型的差別是: - 不只靠模型記憶 - 回答更靠近你的資料 - 比較適合企業或內部知識


2. RAG in n8n 的基本結構

PDF 中提到 embedding、Qdrant、retrieval tool,整理成教學就是:

資料來源 -> 切分 -> Embedding -> Vector DB -> Retrieve -> Agent -> 回答

2.1 Embedding

把文字轉成向量表示,方便搜尋語意相近內容。

2.2 Vector DB

像 Qdrant 這類向量資料庫,負責存放向量與檢索。

2.3 Retrieval

當使用者提問時,先找最相關片段。

2.4 Agent

Agent 根據檢索到的內容產生回答。

這裡最重要的理解是: RAG 不是模型知道更多,而是流程先幫模型找到該看的資料。


3. 為什麼 RAG 很重要

適合的場景: - 公司內部知識庫 - 課程教材問答 - SOP 查詢 - 文件檢索 - 醫院內部流程說明

RAG 的優點: - 降低幻覺 - 回答更有來源依據 - 易於更新資料,不用重訓模型

限制: - 如果資料來源本身差,回答也不會好 - chunking、索引、檢索策略會影響結果


4. Voice Agent 是什麼

Voice Agent 可以理解成:

語音輸入 -> 語音轉文字 -> Agent 處理 -> 回傳

其中多出來的關鍵步驟是: - 語音轉文字 - 有時再加文字轉語音

所以 Voice Agent 其實不是完全不同的東西,而是: Agent workflow + 語音介面


5. Voice RAG Agent 是什麼

Voice RAG Agent 可以理解成:

語音 -> 轉文字 -> 檢索 -> Agent -> 生成回答 -> 文字轉語音

它把三層合起來: - 語音 - RAG - Agent

這種流程很適合: - 語音客服 - 語音查詢知識庫 - 語音助理 - 語音輔助臨床資訊查詢


6. 這和語音記錄案例有什麼關係

對你最直接有用的不是完整 Voice RAG demo,而是這個觀念:

6.1 語音先轉 transcript

不要直接把語音當正式紀錄或最終輸出。

6.2 transcript 再進入 workflow

可以做: - 結構化抽取 - 重點整理 - 草稿生成 - 待辦或提醒抽取

6.3 若未來加知識檢索

可以讓系統: - 查內部 SOP - 查產品或服務說明 - 查客服知識庫 - 查課程教材或作業規範

但這部分更像輔助查詢,不應直接替代需要專業責任的正式判斷。


7. 用教學角度看,這份 PDF 最值得吸收的部分

如果不是要完全複製課堂 demo,而是要吸收架構,最值得留下的是: - RAG 的概念框架 - Voice Agent 的流程觀念 - Voice RAG Agent 的組成 - tool + retrieval + model 的關係

反而不是每個安裝指令或每個 LINE 操作細節都要照搬進你的主教材。


8. 你未來可以怎麼擴充

對你目前的教學與專案,可以往這幾個方向發展:

8.1 教學擴充

  • 做一篇 RAG in n8n 教材
  • 做一篇 Voice transcript workflow 教材

8.2 workflow 擴充

  • transcript -> OpenAI 結構化抽取
  • transcript -> handoff summary
  • transcript -> nursing note draft
  • transcript -> retrieval SOP lookup

8.3 系統擴充

  • 語音前端 + OpenAI Realtime
  • n8n 接 transcript
  • 需要時再加 retrieval

本篇練習

  1. 用自己的話解釋 RAG 是什麼。
  2. 畫出 Voice AgentVoice RAG Agent 的差別。
  3. 想一個你自己的工作場景,判斷它到底需要不需要 RAG。

下一步建議

如果你要把這些概念變成實作,下一步最適合做: - RAG in n8n workflow JSON - 或 Voice transcript + structured extraction workflow JSON