n8n RAG 與 Voice Agent 補充教材¶
這份筆記整理自
260411_素養班_Day5.pdf中與 RAG、Voice Agent、Voice RAG Agent 相關的內容,目的是把你從一般 AI workflow 再往知識檢索與語音互動推進一步。
想一想¶
RAG 的直覺很簡單:不要只叫 AI 憑印象回答,而是先幫它找到相關資料,再讓它根據資料回答。這就像你問同事一個公司制度問題,如果他只是憑記憶回答,可能會錯;如果他先查最新 SOP,再整理給你,可信度就比較高。RAG 的價值不在於讓模型變神,而是讓回答更貼近你提供的文件。
Voice Agent 也是同樣邏輯,只是入口變成語音。語音本身不是重點,重點是語音轉成文字後,後面仍然要走資料整理、判斷、查詢、輸出這些步驟。新手不要一開始就做完整語音助理,可以先做文字版 RAG,確認資料能被正確檢索,再加語音輸入或語音輸出。這樣你會清楚知道問題出在語音辨識、文件檢索、prompt,還是輸出格式。
本篇怎麼讀¶
- 學習目標:理解 RAG、Voice Agent、Voice RAG Agent 在 n8n 中的結構
- 先修需求:已看過 07 n8n + OpenAI 實作範例集 與 08 n8n Agent 基礎補充教材
- 讀完後你應該能:解釋 RAG 的流程、知道 Voice Agent 多了哪些步驟、理解這些概念怎麼應用到不同語音或知識檢索案例
1. RAG 是什麼¶
RAG 的核心不是「更聰明」,而是: - 先找資料 - 再回答
基本流程是: 1. 使用者提問 2. 系統先檢索相關內容 3. 把相關內容交給模型 4. 模型根據資料生成回答
這和直接問模型的差別是: - 不只靠模型記憶 - 回答更靠近你的資料 - 比較適合企業或內部知識
2. RAG in n8n 的基本結構¶
PDF 中提到 embedding、Qdrant、retrieval tool,整理成教學就是:
資料來源 -> 切分 -> Embedding -> Vector DB -> Retrieve -> Agent -> 回答
2.1 Embedding¶
把文字轉成向量表示,方便搜尋語意相近內容。
2.2 Vector DB¶
像 Qdrant 這類向量資料庫,負責存放向量與檢索。
2.3 Retrieval¶
當使用者提問時,先找最相關片段。
2.4 Agent¶
Agent 根據檢索到的內容產生回答。
這裡最重要的理解是:
RAG 不是模型知道更多,而是流程先幫模型找到該看的資料。
3. 為什麼 RAG 很重要¶
適合的場景: - 公司內部知識庫 - 課程教材問答 - SOP 查詢 - 文件檢索 - 醫院內部流程說明
RAG 的優點: - 降低幻覺 - 回答更有來源依據 - 易於更新資料,不用重訓模型
限制: - 如果資料來源本身差,回答也不會好 - chunking、索引、檢索策略會影響結果
4. Voice Agent 是什麼¶
Voice Agent 可以理解成:
語音輸入 -> 語音轉文字 -> Agent 處理 -> 回傳
其中多出來的關鍵步驟是: - 語音轉文字 - 有時再加文字轉語音
所以 Voice Agent 其實不是完全不同的東西,而是:
Agent workflow + 語音介面
5. Voice RAG Agent 是什麼¶
Voice RAG Agent 可以理解成:
語音 -> 轉文字 -> 檢索 -> Agent -> 生成回答 -> 文字轉語音
它把三層合起來: - 語音 - RAG - Agent
這種流程很適合: - 語音客服 - 語音查詢知識庫 - 語音助理 - 語音輔助臨床資訊查詢
6. 這和語音記錄案例有什麼關係¶
對你最直接有用的不是完整 Voice RAG demo,而是這個觀念:
6.1 語音先轉 transcript¶
不要直接把語音當正式紀錄或最終輸出。
6.2 transcript 再進入 workflow¶
可以做: - 結構化抽取 - 重點整理 - 草稿生成 - 待辦或提醒抽取
6.3 若未來加知識檢索¶
可以讓系統: - 查內部 SOP - 查產品或服務說明 - 查客服知識庫 - 查課程教材或作業規範
但這部分更像輔助查詢,不應直接替代需要專業責任的正式判斷。
7. 用教學角度看,這份 PDF 最值得吸收的部分¶
如果不是要完全複製課堂 demo,而是要吸收架構,最值得留下的是: - RAG 的概念框架 - Voice Agent 的流程觀念 - Voice RAG Agent 的組成 - tool + retrieval + model 的關係
反而不是每個安裝指令或每個 LINE 操作細節都要照搬進你的主教材。
8. 你未來可以怎麼擴充¶
對你目前的教學與專案,可以往這幾個方向發展:
8.1 教學擴充¶
- 做一篇
RAG in n8n 教材 - 做一篇
Voice transcript workflow 教材
8.2 workflow 擴充¶
- transcript -> OpenAI 結構化抽取
- transcript -> handoff summary
- transcript -> nursing note draft
- transcript -> retrieval SOP lookup
8.3 系統擴充¶
- 語音前端 + OpenAI Realtime
- n8n 接 transcript
- 需要時再加 retrieval
本篇練習¶
- 用自己的話解釋 RAG 是什麼。
- 畫出
Voice Agent和Voice RAG Agent的差別。 - 想一個你自己的工作場景,判斷它到底需要不需要 RAG。
下一步建議¶
如果你要把這些概念變成實作,下一步最適合做:
- RAG in n8n workflow JSON
- 或 Voice transcript + structured extraction workflow JSON