AI 術語太多？220+ 個詞對照表，2026 持續更新

AI 術語多到一個程度，連從業者也不見得全懂。

按角色分了 11 區，直接跳區就好。


🐣 剛入門	聽過但沒搞懂的那些
💬 日常使用	每天在問 AI，但覺得它可以更聽話
🏢 企業導入	老闆問你 AI 怎麼落地，你需要這些詞
🔧 產品開發	在串 API、搞 RAG、或把 AI 包成產品
🛡️ 安全與倫理	越強的工具，越需要知道怎麼出事
⚡ 效能與成本	跑得動和跑得起是兩回事
🔬 訓練與學習	模型怎麼從白紙變成現在這樣
🧠 架構與評估	神經網路長什麼樣，怎麼知道學得好不好
🖼️ 圖像與多媒體	看圖、生圖、改圖
🗣️ 語音與語言	聽得懂人話、說得出人話
📊 資料分析與預測	有資料就能預測，不用猜

🐣 剛入門（20）
#

術語	說明
AI／人工智慧	不是機器人，是讓電腦學會「判斷」的技術。你每天在用，只是沒發現
Neural Network／神經網路	模仿人腦神經元的數學結構，是現在幾乎所有 AI 的底層
Machine Learning／機器學習	電腦不靠人寫規則，自己從資料裡找規律。餵越多資料，通常越聰明
Parameters／參數	模型裡面有幾十億到幾兆個「可調整的數字」，這些數字決定它怎麼回答。參數越多，能學的東西越多。GPT-4 有超過一兆個
Weights／權重	參數的另一個說法。兩個詞常混著用，差別在 Weights 強調的是「已經訓練好的那組數字」
Compute／算力	跑 AI 需要的計算資源，主要靠 GPU，是 AI 軍備競賽的核心燃料
Singularity／奇點	假設中 AI 智能超越全人類的那個時間點，有人覺得快了，有人覺得根本不會來
AGI／通用人工智慧	AI 界的終極目標：像人一樣能學任何事。現在還沒到，但大家都在衝
Deep Learning／深度學習	機器學習的進化版，靠多層神經網路疊出來的，「深」說的是層數很多
Deepfake／深偽	AI 換臉換聲的偽造技術，真假越來越難分，已經是社會問題
Scaling Laws／規模法則	資料越多、算力越大，模型就越聰明——這個規律目前還大致成立，但在放緩
LLM／大語言模型	ChatGPT、Claude、Gemini 背後的東西，用海量文字訓練出來的超大模型
Token／標記	AI 讀文字的最小單位，大概是半個英文字或半個中文詞，你的帳單按它計費
Foundation Model／基礎模型	先用海量資料練出通才，再針對各種任務微調，現在大部分 AI 都是這個路數
Generative AI／生成式 AI	不只會分類，還會「創作」——寫文章、畫圖、做影片都算
Hallucination／幻覺	AI 一本正經在胡說八道。它不是在說謊，它真的「以為」自己說對了
Context Window／上下文窗口	AI 的短期記憶，決定它能「記住」多長的對話。超過就開始忘東忘西
Knowledge Cutoff／知識截斷	AI 的知識有保鮮期，截止日之後的事它一概不知，問最新消息記得搭配搜尋
Open Weights／開放權重	模型權重公開，你可以下載來自己跑，不用付費，如 Llama
Proprietary Model／閉源模型	看不到內部，只能透過 API 付費用，如 GPT-4o、Claude、Gemini

💬 日常使用（20）
#

術語	說明
Temperature／溫度	控制 AI 的「隨機程度」。調高會更有創意但不穩，調低更穩定但容易重複自己
Top-p／核心採樣	另一種控制輸出多樣性的旋鈕，通常和 Temperature 只需要調一個
Stop Sequence／停止序列	設定一個訊號，AI 看到就停止生成，常用於控制輸出長度
Maximum Length／最大長度	限制 AI 回答的 token 數上限，避免它廢話連篇
Zero-shot	直接問，不給範例。適合簡單任務，複雜的通常要配合 Few-shot
Few-shot	先給幾個例子讓 AI 照著做，準確率和格式一致性通常好很多
In-Context Learning	AI 在對話中透過你給的例子即時學習，不需要重新訓練模型
Prompt／提示詞	你對 AI 說的話。同樣的問題換個說法，答案可以差很多
Prompt Engineering／提示工程	把問 AI 問題這件事變成一門學問。核心就是說清楚你要什麼
System Prompt／系統提示	幫 AI 設定角色和規則的背景指令，通常你看不到，但它一直在影響回答
Persona／人格角色	給 AI 一個身份，「你是一個說話很直接的產品經理」，回答風格就會變
Delimiters／分隔符	用 `###` 或 `"""` 把指令和內容隔開，讓 AI 不要搞混你在說什麼
Negative Prompt／負面提示	告訴 AI「不要出現什麼」，圖像生成常用，也可以用在文字
CoT／思維鏈	叫 AI「一步一步想」，邏輯推理能力大幅提升。加一句「Let’s think step by step」就有效
Iterative Prompting	不要期待第一次就完美，反覆調整指令像雕塑一樣把結果逼出來
Meta-Prompting／元提示	讓 AI 幫你寫更好的 Prompt，以子之矛攻子之盾
Tree of Thought／思維樹	CoT 的進階版，讓 AI 同時探索多條推理路線，挑最好的那條走
Reasoning Model／推理模型	會「先想清楚再回答」的模型，數學和邏輯題更強，如 o1、Claude 3.7
Structured Output／結構化輸出	強制 AI 回傳 JSON 等固定格式，要串接系統的話幾乎必開
Streaming／串流	AI 一個字一個字吐出來，不用等全部算完才回，體感速度差很多

🏢 企業導入（12）
#

術語	說明
Privacy／隱私	你的對話資料會不會被拿去訓練？這是企業導入 AI 最常問的問題之一
Benchmark／基準測試	用標準考題評比模型，幫你選出最適合你業務需求的那個
Latency／延遲	AI 吐出第一個字要多久，使用者感受最直接的效能指標
Throughput／吞吐量	系統每秒能服務多少人，決定你能不能 scale
Knowledge Base／知識庫	餵給 AI 的私房資料，可以是產品手冊、內規、FAQ，AI 只從這裡找答案
Human-in-the-loop	關鍵步驟讓人類點頭才繼續，適合高風險或需要合規的場景
Fine-tuning／微調	讓通用模型針對你的領域變成專家，不是重新訓練，而是在現有基礎上調整
RAG／檢索增強生成	讓 AI 先查你的資料庫再回答，解決「AI 不知道公司內部資訊」的問題，企業 AI 最常見的架構
Grounding／實證	確保 AI 的每個回答都有來源可查，不是憑空生成，降低幻覺風險
Guardrails／護欄	過濾不該說的話，部署在輸入和輸出兩端的安全機制
Local AI／本地端 AI	模型跑在自己的機器上，不上雲，資料不出去，適合對隱私敏感的產業
Agentic Workflow	讓 AI 跑完整個流程，不只是回答問題，而是接任務、查資料、執行、交付

🔧 產品開發（32）
#

術語	說明
API／應用程式介面	AI 和其他系統溝通的管道
Metadata／元數據	文件的標籤，如日期、作者、部門，用來過濾和排序檢索結果
Short-term Memory／短期記憶	當前對話的記錄，關掉就清空
Long-term Memory／長期記憶	跨對話的持續記憶，通常需要外部資料庫支援
Embedding／嵌入	把文字變成一串數字，讓電腦可以計算兩段話有多「像」，RAG 的基礎
Dense Vector／稠密向量	把文字轉成一長串數字，每格都有值，用來捕捉語意。現在主流的嵌入格式
Sparse Vector／稀疏向量	一長串數字但大部分是零，只有命中的關鍵字有值。精確但抓不到同義詞
Similarity Score／相似度分數	兩段文字在向量空間的距離，越高越相關
Bi-Encoder／雙編碼器	兩段文字各自算出向量再比距離，速度快，適合從大量資料裡初步篩選
Cross-Encoder／交叉編碼器	把兩段文字一起餵進模型判斷相關度，比 Bi-Encoder 精準但慢很多，適合精篩
Semantic Search／語義搜索	搜「費用」也能找到「價格」，因為它找的是語意距離，不是文字完全符合
Sandboxing／沙盒	讓 AI 在隔離環境跑程式，出錯不影響正式系統
MoE／混合專家	模型裡塞很多「小專家」，每次只啟動相關的幾個，GPT-4 和 Mixtral 都用這招
Vector Database／向量資料庫	專門存 Embedding 的資料庫，Pinecone、pgvector、Weaviate、Chroma 都是
Chunking／切塊	把長文件切成小段再存進向量庫，切太長找不準，切太短失去脈絡
Document Loader／文檔加載器	把 PDF、Word、網頁讀進系統的工具
Text Splitter／文本分割器	執行 Chunking 的那個元件
Hybrid Search／混合搜索	關鍵字搜索 + 語義搜索一起用，各取優點
Re-ranking／重排序	從向量庫撈出候選後再用精確模型篩一遍，準確率更高
Chain／鏈	把多個 AI 動作串成線性流程
Agent／智能體	能自主規劃下一步、調用工具、執行任務的 AI 程式
Function Calling／函式調用	讓 AI 決定何時呼叫哪個外部函式，是 Agent 能動手做事的關鍵
Tool Use／工具使用	讓 AI 呼叫外部工具的能力，比 Function Calling 更廣，各家都在推
Action／行動	AI 對外部世界做的具體操作，如送出 API 請求、寫入資料庫
Skill／技能	預先定義好的功能模組，掛上去就能用
Orchestration／編排	管理多個 AI 和工具的執行順序，像導演在排戲
Graph／圖架構	比鏈更複雜，有分支和循環，適合處理不確定流程
LoRA／低秩適配	現在最流行的輕量微調法，只動模型的一小部分參數，便宜又快
MCP／模型上下文協議	AI 工具整合的標準介面，像 USB 插座，Anthropic 提出，正在快速普及
Multi-Agent／多智能體	多個 Agent 分工合作完成任務，2025 最熱的方向之一
Context Engineering／上下文工程	Prompt Engineering 的進化版。不只管「怎麼問」，而是設計 AI 看到的一切——系統提示、RAG 結果、工具描述、記憶，全部算在內
Harness Engineering／駕馭工程	當 AI Agent 大量寫程式時，怎麼用 CI、護欄、規格文件確保品質和安全的系統化做法

🛡️ 安全與倫理（14）
#

術語	說明
AI Ethics／AI 倫理	研究 AI 的責任歸屬、公平性和社會衝擊，現在還是個很新的領域
Bias／偏見	訓練資料有偏，模型就有偏，它可能在你沒注意到的地方歧視某些人
Fairness／公平性	讓 AI 對所有人一視同仁，在現實中比說起來難得多
Causal Inference／因果推理	AI 很會找相關性，但相關不等於因果，這個領域在研究怎麼讓 AI 真正理解因果
Adversarial Attacks／對抗性攻擊	對輸入做肉眼看不出的細微修改，讓 AI 做出完全錯誤的判斷
Adversarial Training／對抗性訓練	用攻擊樣本訓練讓模型更強健，提前打預防針
XAI／可解釋性 AI	讓模型說清楚「為什麼做這個決定」，黑箱變透明
Federated Learning／聯邦學習	資料不出門也能一起訓練模型，各方只交換學到的參數，隱私方案
Trustworthy AI／可信 AI	公平、透明、安全、可解釋這四件事都做到，才算「可信」
Alignment／對齊	確保 AI 的目標和人類真正想要的一致，聽起來簡單但是 AI 安全研究最難的問題
Red Teaming／紅隊演練	請專家扮演攻擊者，主動把 AI 系統的漏洞找出來
Prompt Injection／提示注入	把惡意指令藏在輸入裡，誘導 AI 繞過限制做不該做的事
Jailbreaking／越獄	用各種手法繞過 AI 的安全限制，讓它說出或做出不該做的事
AI Watermarking／AI 浮水印	在 AI 生成的內容裡藏隱形標記，用來判斷是不是 AI 產的

⚡ 效能與成本（12）
#

術語	說明
Batch Processing／批處理	把多個請求打包一起送，比一個一個送更省資源
Caching／緩存	常見問題答案先存起來，直接命中不用重算
Hardware Acceleration／硬件加速	GPU、TPU 這類專用晶片讓計算快幾十倍
GPU	AI 算力的主力，NVIDIA H100 是目前最搶手的那顆
Cloud Computing／雲端運算	彈性擴展、按用量付費，不用自己養硬體
Edge Computing／邊緣計算	在裝置本地端算，不用往返雲端，延遲低且資料不外傳
Knowledge Distillation／知識蒸餾	大模型的能力「蒸餾」給小模型，讓小模型也能有大模型的部分能力
Pruning／修剪	剪掉模型裡用不到的部分，輕量化不失效能
Model Compression／模型壓縮	量化、蒸餾、修剪的統稱，目標都是縮小模型
TPU	Google 的 AI 晶片，在 Google Cloud 上用最順
Quantization／量化	把模型精度從 32 位壓到 8 位，體積縮小、速度加快，精度略降
Inference Optimization／推理優化	讓模型推理變快的各種工程手段

🔬 訓練與學習（34）
#

術語	說明
Supervised Learning／監督學習	給題目也給答案，讓模型學對應關係，最常見的訓練方式
Unsupervised Learning／無監督學習	只給資料不給答案，讓模型自己找結構
Reinforcement Learning／強化學習	靠試錯和獎懲學習，AlphaGo 就是這樣練出來的
Loss Function／損失函數	衡量模型答錯多少的指標，訓練就是讓它越來越小
Gradient Descent／梯度下降	沿著損失函數的斜坡往下走，找最低點就是最佳參數
Learning Rate／學習率	每次更新參數的步伐大小，太大跳過最優解，太小學一輩子
Optimization／優化	調整參數讓損失函數越來越小的過程
Overfitting／過度擬合	模型把訓練集背起來了，但碰到新資料就崩，像只會背答案的學生
Underfitting／欠擬合	模型太簡單，連訓練集都學不好
Regularization／正則化	防止過擬合的技術，強迫模型不能死記
Training Set／訓練集	用來訓練的資料
Validation Set／驗證集	訓練中用來調超參數的資料，不算在訓練裡
Test Set／測試集	訓練結束才動用，評估模型真實表現
Cross-validation／交叉驗證	資料輪流當測試集，比單次分割更可靠地評估模型
Epoch／輪次	把全部訓練資料看過一遍算一個 Epoch
Batch Size／批次大小	每次更新參數用幾筆資料，影響訓練速度和穩定性
Hyperparameter／超參數	訓練前要手動設定的參數，如學習率、批次大小，調參就是在調這個
Backpropagation／反向傳播	訓練神經網路的核心算法，從輸出誤差反推每層要調整多少
Semi-Supervised Learning／半監督學習	少量有標籤 + 大量無標籤混著用，兩者折中
Data Augmentation／資料增強	對現有資料做旋轉、裁切等變換，人工把訓練集放大
Transfer Learning／遷移學習	A 任務學到的知識拿來用在 B 任務，Fine-tuning 是其中一種
Zero-Shot Learning／零樣本學習	訓練時沒見過的類別，也能認出來
Domain Adaptation／領域適配	解決訓練環境和實際使用環境資料分布不同的問題
Domain Generalization／領域泛化	讓模型在從沒見過的新領域也能保持水準
Dropout	訓練時隨機關掉部分神經元，逼模型不能依賴特定路徑
Batch Normalization	每一層開始算之前，先把數值調整到差不多的範圍，避免某些數字太大帶歪整個計算
Meta-Learning／元學習	「學習如何學習」，讓模型用少量新資料快速適應新任務
Few-Shot Learning／少樣本學習	只用幾個例子就能學會新任務，這是訓練策略不只是 Prompt 技巧
Pre-training／預訓練	先用海量無標籤資料讓模型學語言，這個階段最貴、最耗算力
Synthetic Data／合成資料	用 AI 生成假資料來訓練 AI，解決資料不夠的問題
SFT／監督微調	用人類寫好的範例直接教模型，是 Fine-tuning 最基本的操作方式
Instruction Tuning／指令微調	讓模型學會「聽指令辦事」，是 ChatGPT 從基礎模型變成對話模型的關鍵步驟
RLHF／人類回饋強化學習	人類評分讓模型學什麼樣的回答是好的，ChatGPT 變得「好用」的關鍵
DPO／直接偏好優化	RLHF 的簡化替代方案，不需要額外訓練獎勵模型，越來越多新模型改用這個

🧠 架構與評估（19）
#

術語	說明
Activation Function／激活函數	決定神經元要不要「亮起來」的開關。沒有它，神經網路再多層也只是在做加減乘除
Softmax	把一組分數轉成「各選項的機率」，加起來剛好 100%。模型最後一步常用它來選答案
Accuracy／準確率	答對的比例，直觀但資料不平衡時會騙人
Precision／精確率	預測是正的裡面，真的是正的比例——「報的準不準」
Recall／召回率	真正是正的裡面，找到了多少——「找得全不全」
F1 Score	同時考慮「報得準不準」和「找得全不全」的綜合分數，兩邊都不能太差
Confusion Matrix／混淆矩陣	預測結果和真實結果交叉表，一眼看出哪裡出錯
AUC-ROC	衡量分類模型整體區分能力，越接近 1 越好
Bayesian Network／貝葉斯網路	用圖把「A 會影響 B、B 會影響 C」的機率關係畫出來，擅長處理不確定的情況
Autoencoder／自編碼器	把資料壓縮再還原，學會保留最重要的特徵
RNN／循環神經網路	擅長序列資料，但有記憶遺忘問題，現在幾乎被 Transformer 取代
LSTM／長短期記憶	改良版 RNN，解決了遺忘問題，曾是 NLP 主流
VAE／變分自編碼器	學習資料的壓縮表示，可以用來生成新樣本
Seq2Seq／序列到序列	輸入一個序列輸出另一個序列，翻譯模型的基礎架構
Attention Mechanism／注意力機制	讓模型在處理每個詞時能「看」整個輸入並決定哪些重要，Transformer 的靈魂
Transformer	現代 AI 的核心架構，2017 年那篇論文之後，幾乎所有 LLM 都是這個底
Self-Attention／自注意力	序列中每個位置都能直接看到其他位置，解決了 RNN 遠距離依賴的問題
NAS／神經架構搜索	讓 AI 自動找最優網路架構，省去人工試錯
Neuro-Symbolic AI	神經網路的感知 + 符號邏輯的推理，兩種 AI 路線的合體嘗試

🖼️ 圖像與多媒體（18）
#

術語	說明
Computer Vision／電腦視覺	讓電腦「看懂」圖片和影片的技術領域
CNN／卷積神經網路	圖像處理的主力，能自動提取空間特徵
Face Detection／人臉檢測	找到臉在哪裡，但不認識是誰
Object Detection／目標檢測	找到圖裡的物體並標出位置，如「左上角有一隻貓」
Face Recognition／人臉識別	認出這張臉是誰，用於門禁、解鎖、支付
GANs／生成對抗網路	生成器和判別器互相對抗，一個造假一個鑑假，越來越強
Semantic Segmentation／語義分割	每個像素都分類，精確到像素級別的「哪裡是路哪裡是車」
Pose Estimation／姿態估計	識別人體各關節的位置，用於動作捕捉、健身 AI
Neural Style Transfer	把一張圖的藝術風格轉移到另一張圖上，如把照片變梵谷畫風
Image Captioning	自動幫圖片寫說明文字
VQA／視覺問答	看圖回答問題，「這張圖裡有幾個人？」
Instance Segmentation／實例分割	比語義分割更進一步，同類別的不同個體也能分開
Video Understanding／視頻理解	看懂影片裡在幹嘛，理解動作、場景和時序
Image Generation／圖像生成	從文字描述生成全新圖像，Stable Diffusion、Midjourney、DALL-E
Diffusion Model／擴散模型	現在圖像生成的主力架構，從雜訊中一步步還原出圖片，Stable Diffusion 的底層
Multimodal Learning／多模態學習	同時處理文字、圖像、音頻的 AI，GPT-4o 就是
Inpainting／局部重繪	指定圖片中的一塊區域讓 AI 重新生成，修圖神器
ControlNet	精確控制圖像生成的姿勢、構圖、邊緣，讓 AI 畫圖不再全靠運氣

🗣️ 語音與語言（13）
#

術語	說明
NLP／自然語言處理	讓電腦理解、生成、操作人類語言的整個技術領域
Machine Translation／機器翻譯	自動翻譯，Google Translate、DeepL 背後的核心
Speech Recognition／語音識別	把說的話轉成文字（STT），Whisper 是目前最強的開源模型
TTS／語音合成	把文字變成說話聲音，現在已經很難和真人分辨
POS Tagging／詞性標註	幫每個詞標上詞性，是很多 NLP 任務的前處理
NER／命名實體識別	從文字裡抓出人名、地名、組織名
Information Extraction／信息抽取	從非結構化文字裡提取結構化資訊，如關係、事件
Question Answering／問答系統	自動回答自然語言問題
Text Summarization／摘要生成	長文自動壓縮成重點
Sentiment Analysis／情感分析	判斷文字是正面還是負面，客服和品牌監控常用
Knowledge Graph／知識圖譜	用節點和邊表示概念間的關係，Google 知識卡片就是這個
Word Embedding／詞嵌入	把詞變成向量，語意相近的詞在空間中也相近，Word2Vec 是經典
Emotion Recognition／情緒識別	從文字、聲音或表情識別具體情緒，如喜怒哀樂

📊 資料分析與預測（20）
#

術語	說明
Regression／回歸	預測連續數值，如房價、銷售額、溫度
Classification／分類	預測資料屬於哪個類別，如垃圾郵件判斷、客戶分群
PCA／主成分分析	最常見的線性降維方法
Dimensionality Reduction／降維	高維資料壓成低維，保留關鍵資訊去掉雜訊
Feature Engineering／特徵工程	從原始資料中手動挑出對模型有用的特徵，傳統 ML 的核心技能
Feature Extraction／特徵提取	深度學習的優勢：自動從原始資料找特徵，不用人工
K-Means Clustering	最常見的聚類算法，把資料分成 K 群
Clustering／聚類	把相似資料自動分群，不需要預先定義類別
Decision Tree／決策樹	像流程圖一樣的分類器，簡單直觀好解釋，也好向主管說明
Time Series Analysis／時間序列分析	分析按時間排列的資料，找趨勢和週期
Trend／趨勢	資料長期變化的方向
Seasonality／季節性	資料的週期性規律，如每年同期的模式
Forecasting／預測	根據歷史資料預測未來，如銷售預測、需求預測
Collaborative Filtering／協同過濾	「和你相似的人也喜歡這個」，Netflix 和電商推薦背後的邏輯
Content-Based Filtering／內容過濾	根據物品本身特徵推薦，「你喜歡動作片，所以推薦動作片」
Anomaly Detection／異常檢測	找出不正常的資料點，用於詐騙偵測、設備監控
Outlier Detection／離群值檢測	找出統計上偏離太遠的資料點
Random Forest／隨機森林	很多棵決策樹投票，比單棵樹準且穩定
Hybrid Recommendation／混合推薦	兩種推薦方式合體，取各自優點
Distributed Representations	用一組數字描述一個詞的各種特性，而不是只給它一個編號。Word2Vec 就是這個概念

有新詞會繼續加。

🐣 剛入門（20） #

💬 日常使用（20） #

🏢 企業導入（12） #

🔧 產品開發（32） #

🛡️ 安全與倫理（14） #

⚡ 效能與成本（12） #

🔬 訓練與學習（34） #

🧠 架構與評估（19） #

🖼️ 圖像與多媒體（18） #

🗣️ 語音與語言（13） #

📊 資料分析與預測（20） #

🐣 剛入門（20）
#

💬 日常使用（20）
#

🏢 企業導入（12）
#

🔧 產品開發（32）
#

🛡️ 安全與倫理（14）
#

⚡ 效能與成本（12）
#

🔬 訓練與學習（34）
#

🧠 架構與評估（19）
#

🖼️ 圖像與多媒體（18）
#

🗣️ 語音與語言（13）
#

📊 資料分析與預測（20）
#