跳轉到

n8n Agent 基礎補充教材

這份筆記整理自 260411_素養班_Day5.pdf 中與 AI Agent 基礎有關的內容,重點放在 Agentic Workflow、Agent 的組成、n8n 中的 Agent 架構,以及為什麼要用 tool / memory / planning。

想一想

Agent 聽起來很進階,但可以先用一個簡單比喻理解:普通 workflow 像固定路線的公車,站點已經排好;Agent 比較像有目標的助理,它會根據任務判斷要不要查資料、要不要使用工具、下一步該做什麼。差別不只是「有沒有 AI」,而是流程中是否出現了模型的判斷與工具選擇。

不過,Agent 不是越自由越好。對初學者來說,Agent 最重要的設計不是讓它什麼都能做,而是讓它只在清楚範圍內做事。你要先定義任務、提供工具、寫清楚限制,再決定哪些結果需要人確認。如果工具描述不清楚,Agent 可能會用錯工具;如果權限太大,它可能做出你不想要的動作。所以學 Agent 時,要同時學能力與邊界:它可以幫你決策,但你仍然要設計規則、資料來源與安全欄杆。

本篇怎麼讀

  • 學習目標:理解 AI Agent 與一般 workflow 的差別
  • 先修需求:已看過 02 n8n 新手入門完整教學07 n8n + OpenAI 實作範例集
  • 讀完後你應該能:分辨普通 workflow 和 agent workflow、說明 agent 的基本部件、理解 model / memory / tool / planning 在 n8n 中的角色

1. 什麼是 Agentic Workflow

一般 workflow 比較像固定腳本: - 有一個 trigger - 跑固定步驟 - 回傳結果

Agentic Workflow 更像一個會思考的流程: - 接收任務 - 理解目標 - 拆解步驟 - 視需要調用工具 - 檢查目前結果 - 決定下一步

最核心的差別不是「有沒有 AI」,而是: - 有沒有決策 - 有沒有工具調度 - 有沒有反覆修正

可以簡化理解: 普通 workflow = 固定路線 agent workflow = 會判斷路線的流程


2. AI Agent 的基本組成

2.1 Agent Core

通常就是模型本身,負責: - 理解任務 - 推理 - 決策 - 判斷要不要找工具

2.2 Memory

讓 Agent 不只看眼前一句話。

常見兩種: - 短期記憶:保留這次對話或這次任務上下文 - 長期記憶:保留規章、知識、過去紀錄

2.3 Tools

Tool 是 Agent 的手腳。

例如: - 搜尋 - 試算表 - 資料庫 - 檔案 - LINE / Slack / Email - 各種 API

沒有 tool,Agent 多半只能回答,不能真正完成工作。

2.4 Planning

Planning 是把任務拆小,安排步驟。

例如: - 先理解問題 - 再判斷資料夠不夠 - 不夠就搜尋或查資料 - 再彙整輸出


3. 為什麼這些概念在 n8n 特別好教

n8n 的優勢不只是能拖拉節點,而是它很適合把 Agent 結構視覺化。

你可以清楚看到: - trigger 在哪裡 - model 在哪裡 - memory 在哪裡 - tool 在哪裡 - output 怎麼流

對學習來說,這比只看程式碼更容易理解 Agent 到底在做什麼。


4. n8n 裡 AI Agent 的骨架

可以先用這個骨架理解:

Chat Trigger -> Agent -> Chat Model -> Memory -> Tools -> Output

你會看到幾個關鍵部分:

4.1 Chat Trigger

負責接使用者輸入。

4.2 System Prompt

定義 Agent 的角色、規則、限制。

例如: - 只能用繁體中文回答 - 不知道就先查工具 - 不可自行編造資料

4.3 Chat Model

模型本身可以是: - OpenAI - Ollama - LM Studio - Anthropic - Azure OpenAI

4.4 Memory

決定要保留多少上下文。

4.5 Tools

負責實際執行動作,例如搜尋、查資料表、寫資料、發訊息。


5. 地端模型與雲端模型

PDF 內提到 Ollama、LM Studio、OpenAI,這很適合整理成部署思維。

地端模型

優點: - 資料不出門 - 容易做內網與隱私控管

限制: - 部署與維運較麻煩 - 模型能力可能不如雲端頂級模型

雲端模型

優點: - 整合快 - 模型能力通常較強

限制: - 要注意敏感資料 - 有 API 成本

重點不是哪個比較強,而是: 你的資料適合在哪裡跑


6. Tool 的價值

Tool 的真正價值不只是搜尋,而是讓 Agent 有辦法做事。

可以分幾類:

6.1 搜尋工具

  • Google Search
  • SerpAPI

6.2 資料工具

  • Google Sheets
  • 資料庫
  • CRM

6.3 通訊工具

  • LINE
  • Slack
  • Email

6.4 檔案工具

  • 讀寫檔案
  • 轉檔
  • 處理文件

6.5 Retrieval 工具

  • 向量資料庫
  • 文件檢索

一句話: Tool 決定 Agent 能不能真的完成任務。


7. 這對你自己的專案有什麼啟發

如果你正在做護理床邊語音記錄,這份 Agent 基礎最值得吸收的是: - Agent 可以調工具,不只是聊天 - 語音流程可以先變 transcript - transcript 可再交給 workflow 或 agent 做整理 - 最後輸出草稿,而不是直接變正式紀錄

這也是為什麼你後面做的 workflow 比較合理的方向會是:

語音 -> transcript -> 抽欄位 -> 草稿 -> 人工確認


本篇練習

  1. 用自己的話解釋 普通 workflowagent workflow 的差別。
  2. 說明 memory、tool、planning 各自負責什麼。
  3. 想一個你的工作場景,列出至少 3 個需要的 tools。

下一篇建議

如果你想接著理解知識檢索、RAG 與語音 Agent,下一步讀 10 n8n RAG 與 Voice Agent 補充教材