快轉到主要內容
  1. AI/

AI 術語太多?220+ 個詞對照表,2026 持續更新

Idle Engineer
作者
Idle Engineer
AI Runs. I Nap. | 404 Career Not Found
目錄

AI 術語多到一個程度,連從業者也不見得全懂。

按角色分了 11 區,直接跳區就好。

🐣 剛入門 聽過但沒搞懂的那些
💬 日常使用 每天在問 AI,但覺得它可以更聽話
🏢 企業導入 老闆問你 AI 怎麼落地,你需要這些詞
🔧 產品開發 在串 API、搞 RAG、或把 AI 包成產品
🛡️ 安全與倫理 越強的工具,越需要知道怎麼出事
效能與成本 跑得動和跑得起是兩回事
🔬 訓練與學習 模型怎麼從白紙變成現在這樣
🧠 架構與評估 神經網路長什麼樣,怎麼知道學得好不好
🖼️ 圖像與多媒體 看圖、生圖、改圖
🗣️ 語音與語言 聽得懂人話、說得出人話
📊 資料分析與預測 有資料就能預測,不用猜

🐣 剛入門(20)
#

術語 說明
AI/人工智慧 不是機器人,是讓電腦學會「判斷」的技術。你每天在用,只是沒發現
Neural Network/神經網路 模仿人腦神經元的數學結構,是現在幾乎所有 AI 的底層
Machine Learning/機器學習 電腦不靠人寫規則,自己從資料裡找規律。餵越多資料,通常越聰明
Parameters/參數 模型裡面有幾十億到幾兆個「可調整的數字」,這些數字決定它怎麼回答。參數越多,能學的東西越多。GPT-4 有超過一兆個
Weights/權重 參數的另一個說法。兩個詞常混著用,差別在 Weights 強調的是「已經訓練好的那組數字」
Compute/算力 跑 AI 需要的計算資源,主要靠 GPU,是 AI 軍備競賽的核心燃料
Singularity/奇點 假設中 AI 智能超越全人類的那個時間點,有人覺得快了,有人覺得根本不會來
AGI/通用人工智慧 AI 界的終極目標:像人一樣能學任何事。現在還沒到,但大家都在衝
Deep Learning/深度學習 機器學習的進化版,靠多層神經網路疊出來的,「深」說的是層數很多
Deepfake/深偽 AI 換臉換聲的偽造技術,真假越來越難分,已經是社會問題
Scaling Laws/規模法則 資料越多、算力越大,模型就越聰明——這個規律目前還大致成立,但在放緩
LLM/大語言模型 ChatGPT、Claude、Gemini 背後的東西,用海量文字訓練出來的超大模型
Token/標記 AI 讀文字的最小單位,大概是半個英文字或半個中文詞,你的帳單按它計費
Foundation Model/基礎模型 先用海量資料練出通才,再針對各種任務微調,現在大部分 AI 都是這個路數
Generative AI/生成式 AI 不只會分類,還會「創作」——寫文章、畫圖、做影片都算
Hallucination/幻覺 AI 一本正經在胡說八道。它不是在說謊,它真的「以為」自己說對了
Context Window/上下文窗口 AI 的短期記憶,決定它能「記住」多長的對話。超過就開始忘東忘西
Knowledge Cutoff/知識截斷 AI 的知識有保鮮期,截止日之後的事它一概不知,問最新消息記得搭配搜尋
Open Weights/開放權重 模型權重公開,你可以下載來自己跑,不用付費,如 Llama
Proprietary Model/閉源模型 看不到內部,只能透過 API 付費用,如 GPT-4o、Claude、Gemini

💬 日常使用(20)
#

術語 說明
Temperature/溫度 控制 AI 的「隨機程度」。調高會更有創意但不穩,調低更穩定但容易重複自己
Top-p/核心採樣 另一種控制輸出多樣性的旋鈕,通常和 Temperature 只需要調一個
Stop Sequence/停止序列 設定一個訊號,AI 看到就停止生成,常用於控制輸出長度
Maximum Length/最大長度 限制 AI 回答的 token 數上限,避免它廢話連篇
Zero-shot 直接問,不給範例。適合簡單任務,複雜的通常要配合 Few-shot
Few-shot 先給幾個例子讓 AI 照著做,準確率和格式一致性通常好很多
In-Context Learning AI 在對話中透過你給的例子即時學習,不需要重新訓練模型
Prompt/提示詞 你對 AI 說的話。同樣的問題換個說法,答案可以差很多
Prompt Engineering/提示工程 把問 AI 問題這件事變成一門學問。核心就是說清楚你要什麼
System Prompt/系統提示 幫 AI 設定角色和規則的背景指令,通常你看不到,但它一直在影響回答
Persona/人格角色 給 AI 一個身份,「你是一個說話很直接的產品經理」,回答風格就會變
Delimiters/分隔符 ###""" 把指令和內容隔開,讓 AI 不要搞混你在說什麼
Negative Prompt/負面提示 告訴 AI「不要出現什麼」,圖像生成常用,也可以用在文字
CoT/思維鏈 叫 AI「一步一步想」,邏輯推理能力大幅提升。加一句「Let’s think step by step」就有效
Iterative Prompting 不要期待第一次就完美,反覆調整指令像雕塑一樣把結果逼出來
Meta-Prompting/元提示 讓 AI 幫你寫更好的 Prompt,以子之矛攻子之盾
Tree of Thought/思維樹 CoT 的進階版,讓 AI 同時探索多條推理路線,挑最好的那條走
Reasoning Model/推理模型 會「先想清楚再回答」的模型,數學和邏輯題更強,如 o1、Claude 3.7
Structured Output/結構化輸出 強制 AI 回傳 JSON 等固定格式,要串接系統的話幾乎必開
Streaming/串流 AI 一個字一個字吐出來,不用等全部算完才回,體感速度差很多

🏢 企業導入(12)
#

術語 說明
Privacy/隱私 你的對話資料會不會被拿去訓練?這是企業導入 AI 最常問的問題之一
Benchmark/基準測試 用標準考題評比模型,幫你選出最適合你業務需求的那個
Latency/延遲 AI 吐出第一個字要多久,使用者感受最直接的效能指標
Throughput/吞吐量 系統每秒能服務多少人,決定你能不能 scale
Knowledge Base/知識庫 餵給 AI 的私房資料,可以是產品手冊、內規、FAQ,AI 只從這裡找答案
Human-in-the-loop 關鍵步驟讓人類點頭才繼續,適合高風險或需要合規的場景
Fine-tuning/微調 讓通用模型針對你的領域變成專家,不是重新訓練,而是在現有基礎上調整
RAG/檢索增強生成 讓 AI 先查你的資料庫再回答,解決「AI 不知道公司內部資訊」的問題,企業 AI 最常見的架構
Grounding/實證 確保 AI 的每個回答都有來源可查,不是憑空生成,降低幻覺風險
Guardrails/護欄 過濾不該說的話,部署在輸入和輸出兩端的安全機制
Local AI/本地端 AI 模型跑在自己的機器上,不上雲,資料不出去,適合對隱私敏感的產業
Agentic Workflow 讓 AI 跑完整個流程,不只是回答問題,而是接任務、查資料、執行、交付

🔧 產品開發(32)
#

術語 說明
API/應用程式介面 AI 和其他系統溝通的管道
Metadata/元數據 文件的標籤,如日期、作者、部門,用來過濾和排序檢索結果
Short-term Memory/短期記憶 當前對話的記錄,關掉就清空
Long-term Memory/長期記憶 跨對話的持續記憶,通常需要外部資料庫支援
Embedding/嵌入 把文字變成一串數字,讓電腦可以計算兩段話有多「像」,RAG 的基礎
Dense Vector/稠密向量 把文字轉成一長串數字,每格都有值,用來捕捉語意。現在主流的嵌入格式
Sparse Vector/稀疏向量 一長串數字但大部分是零,只有命中的關鍵字有值。精確但抓不到同義詞
Similarity Score/相似度分數 兩段文字在向量空間的距離,越高越相關
Bi-Encoder/雙編碼器 兩段文字各自算出向量再比距離,速度快,適合從大量資料裡初步篩選
Cross-Encoder/交叉編碼器 把兩段文字一起餵進模型判斷相關度,比 Bi-Encoder 精準但慢很多,適合精篩
Semantic Search/語義搜索 搜「費用」也能找到「價格」,因為它找的是語意距離,不是文字完全符合
Sandboxing/沙盒 讓 AI 在隔離環境跑程式,出錯不影響正式系統
MoE/混合專家 模型裡塞很多「小專家」,每次只啟動相關的幾個,GPT-4 和 Mixtral 都用這招
Vector Database/向量資料庫 專門存 Embedding 的資料庫,Pinecone、pgvector、Weaviate、Chroma 都是
Chunking/切塊 把長文件切成小段再存進向量庫,切太長找不準,切太短失去脈絡
Document Loader/文檔加載器 把 PDF、Word、網頁讀進系統的工具
Text Splitter/文本分割器 執行 Chunking 的那個元件
Hybrid Search/混合搜索 關鍵字搜索 + 語義搜索一起用,各取優點
Re-ranking/重排序 從向量庫撈出候選後再用精確模型篩一遍,準確率更高
Chain/鏈 把多個 AI 動作串成線性流程
Agent/智能體 能自主規劃下一步、調用工具、執行任務的 AI 程式
Function Calling/函式調用 讓 AI 決定何時呼叫哪個外部函式,是 Agent 能動手做事的關鍵
Tool Use/工具使用 讓 AI 呼叫外部工具的能力,比 Function Calling 更廣,各家都在推
Action/行動 AI 對外部世界做的具體操作,如送出 API 請求、寫入資料庫
Skill/技能 預先定義好的功能模組,掛上去就能用
Orchestration/編排 管理多個 AI 和工具的執行順序,像導演在排戲
Graph/圖架構 比鏈更複雜,有分支和循環,適合處理不確定流程
LoRA/低秩適配 現在最流行的輕量微調法,只動模型的一小部分參數,便宜又快
MCP/模型上下文協議 AI 工具整合的標準介面,像 USB 插座,Anthropic 提出,正在快速普及
Multi-Agent/多智能體 多個 Agent 分工合作完成任務,2025 最熱的方向之一
Context Engineering/上下文工程 Prompt Engineering 的進化版。不只管「怎麼問」,而是設計 AI 看到的一切——系統提示、RAG 結果、工具描述、記憶,全部算在內
Harness Engineering/駕馭工程 當 AI Agent 大量寫程式時,怎麼用 CI、護欄、規格文件確保品質和安全的系統化做法

🛡️ 安全與倫理(14)
#

術語 說明
AI Ethics/AI 倫理 研究 AI 的責任歸屬、公平性和社會衝擊,現在還是個很新的領域
Bias/偏見 訓練資料有偏,模型就有偏,它可能在你沒注意到的地方歧視某些人
Fairness/公平性 讓 AI 對所有人一視同仁,在現實中比說起來難得多
Causal Inference/因果推理 AI 很會找相關性,但相關不等於因果,這個領域在研究怎麼讓 AI 真正理解因果
Adversarial Attacks/對抗性攻擊 對輸入做肉眼看不出的細微修改,讓 AI 做出完全錯誤的判斷
Adversarial Training/對抗性訓練 用攻擊樣本訓練讓模型更強健,提前打預防針
XAI/可解釋性 AI 讓模型說清楚「為什麼做這個決定」,黑箱變透明
Federated Learning/聯邦學習 資料不出門也能一起訓練模型,各方只交換學到的參數,隱私方案
Trustworthy AI/可信 AI 公平、透明、安全、可解釋這四件事都做到,才算「可信」
Alignment/對齊 確保 AI 的目標和人類真正想要的一致,聽起來簡單但是 AI 安全研究最難的問題
Red Teaming/紅隊演練 請專家扮演攻擊者,主動把 AI 系統的漏洞找出來
Prompt Injection/提示注入 把惡意指令藏在輸入裡,誘導 AI 繞過限制做不該做的事
Jailbreaking/越獄 用各種手法繞過 AI 的安全限制,讓它說出或做出不該做的事
AI Watermarking/AI 浮水印 在 AI 生成的內容裡藏隱形標記,用來判斷是不是 AI 產的

⚡ 效能與成本(12)
#

術語 說明
Batch Processing/批處理 把多個請求打包一起送,比一個一個送更省資源
Caching/緩存 常見問題答案先存起來,直接命中不用重算
Hardware Acceleration/硬件加速 GPU、TPU 這類專用晶片讓計算快幾十倍
GPU AI 算力的主力,NVIDIA H100 是目前最搶手的那顆
Cloud Computing/雲端運算 彈性擴展、按用量付費,不用自己養硬體
Edge Computing/邊緣計算 在裝置本地端算,不用往返雲端,延遲低且資料不外傳
Knowledge Distillation/知識蒸餾 大模型的能力「蒸餾」給小模型,讓小模型也能有大模型的部分能力
Pruning/修剪 剪掉模型裡用不到的部分,輕量化不失效能
Model Compression/模型壓縮 量化、蒸餾、修剪的統稱,目標都是縮小模型
TPU Google 的 AI 晶片,在 Google Cloud 上用最順
Quantization/量化 把模型精度從 32 位壓到 8 位,體積縮小、速度加快,精度略降
Inference Optimization/推理優化 讓模型推理變快的各種工程手段

🔬 訓練與學習(34)
#

術語 說明
Supervised Learning/監督學習 給題目也給答案,讓模型學對應關係,最常見的訓練方式
Unsupervised Learning/無監督學習 只給資料不給答案,讓模型自己找結構
Reinforcement Learning/強化學習 靠試錯和獎懲學習,AlphaGo 就是這樣練出來的
Loss Function/損失函數 衡量模型答錯多少的指標,訓練就是讓它越來越小
Gradient Descent/梯度下降 沿著損失函數的斜坡往下走,找最低點就是最佳參數
Learning Rate/學習率 每次更新參數的步伐大小,太大跳過最優解,太小學一輩子
Optimization/優化 調整參數讓損失函數越來越小的過程
Overfitting/過度擬合 模型把訓練集背起來了,但碰到新資料就崩,像只會背答案的學生
Underfitting/欠擬合 模型太簡單,連訓練集都學不好
Regularization/正則化 防止過擬合的技術,強迫模型不能死記
Training Set/訓練集 用來訓練的資料
Validation Set/驗證集 訓練中用來調超參數的資料,不算在訓練裡
Test Set/測試集 訓練結束才動用,評估模型真實表現
Cross-validation/交叉驗證 資料輪流當測試集,比單次分割更可靠地評估模型
Epoch/輪次 把全部訓練資料看過一遍算一個 Epoch
Batch Size/批次大小 每次更新參數用幾筆資料,影響訓練速度和穩定性
Hyperparameter/超參數 訓練前要手動設定的參數,如學習率、批次大小,調參就是在調這個
Backpropagation/反向傳播 訓練神經網路的核心算法,從輸出誤差反推每層要調整多少
Semi-Supervised Learning/半監督學習 少量有標籤 + 大量無標籤混著用,兩者折中
Data Augmentation/資料增強 對現有資料做旋轉、裁切等變換,人工把訓練集放大
Transfer Learning/遷移學習 A 任務學到的知識拿來用在 B 任務,Fine-tuning 是其中一種
Zero-Shot Learning/零樣本學習 訓練時沒見過的類別,也能認出來
Domain Adaptation/領域適配 解決訓練環境和實際使用環境資料分布不同的問題
Domain Generalization/領域泛化 讓模型在從沒見過的新領域也能保持水準
Dropout 訓練時隨機關掉部分神經元,逼模型不能依賴特定路徑
Batch Normalization 每一層開始算之前,先把數值調整到差不多的範圍,避免某些數字太大帶歪整個計算
Meta-Learning/元學習 「學習如何學習」,讓模型用少量新資料快速適應新任務
Few-Shot Learning/少樣本學習 只用幾個例子就能學會新任務,這是訓練策略不只是 Prompt 技巧
Pre-training/預訓練 先用海量無標籤資料讓模型學語言,這個階段最貴、最耗算力
Synthetic Data/合成資料 用 AI 生成假資料來訓練 AI,解決資料不夠的問題
SFT/監督微調 用人類寫好的範例直接教模型,是 Fine-tuning 最基本的操作方式
Instruction Tuning/指令微調 讓模型學會「聽指令辦事」,是 ChatGPT 從基礎模型變成對話模型的關鍵步驟
RLHF/人類回饋強化學習 人類評分讓模型學什麼樣的回答是好的,ChatGPT 變得「好用」的關鍵
DPO/直接偏好優化 RLHF 的簡化替代方案,不需要額外訓練獎勵模型,越來越多新模型改用這個

🧠 架構與評估(19)
#

術語 說明
Activation Function/激活函數 決定神經元要不要「亮起來」的開關。沒有它,神經網路再多層也只是在做加減乘除
Softmax 把一組分數轉成「各選項的機率」,加起來剛好 100%。模型最後一步常用它來選答案
Accuracy/準確率 答對的比例,直觀但資料不平衡時會騙人
Precision/精確率 預測是正的裡面,真的是正的比例——「報的準不準」
Recall/召回率 真正是正的裡面,找到了多少——「找得全不全」
F1 Score 同時考慮「報得準不準」和「找得全不全」的綜合分數,兩邊都不能太差
Confusion Matrix/混淆矩陣 預測結果和真實結果交叉表,一眼看出哪裡出錯
AUC-ROC 衡量分類模型整體區分能力,越接近 1 越好
Bayesian Network/貝葉斯網路 用圖把「A 會影響 B、B 會影響 C」的機率關係畫出來,擅長處理不確定的情況
Autoencoder/自編碼器 把資料壓縮再還原,學會保留最重要的特徵
RNN/循環神經網路 擅長序列資料,但有記憶遺忘問題,現在幾乎被 Transformer 取代
LSTM/長短期記憶 改良版 RNN,解決了遺忘問題,曾是 NLP 主流
VAE/變分自編碼器 學習資料的壓縮表示,可以用來生成新樣本
Seq2Seq/序列到序列 輸入一個序列輸出另一個序列,翻譯模型的基礎架構
Attention Mechanism/注意力機制 讓模型在處理每個詞時能「看」整個輸入並決定哪些重要,Transformer 的靈魂
Transformer 現代 AI 的核心架構,2017 年那篇論文之後,幾乎所有 LLM 都是這個底
Self-Attention/自注意力 序列中每個位置都能直接看到其他位置,解決了 RNN 遠距離依賴的問題
NAS/神經架構搜索 讓 AI 自動找最優網路架構,省去人工試錯
Neuro-Symbolic AI 神經網路的感知 + 符號邏輯的推理,兩種 AI 路線的合體嘗試

🖼️ 圖像與多媒體(18)
#

術語 說明
Computer Vision/電腦視覺 讓電腦「看懂」圖片和影片的技術領域
CNN/卷積神經網路 圖像處理的主力,能自動提取空間特徵
Face Detection/人臉檢測 找到臉在哪裡,但不認識是誰
Object Detection/目標檢測 找到圖裡的物體並標出位置,如「左上角有一隻貓」
Face Recognition/人臉識別 認出這張臉是誰,用於門禁、解鎖、支付
GANs/生成對抗網路 生成器和判別器互相對抗,一個造假一個鑑假,越來越強
Semantic Segmentation/語義分割 每個像素都分類,精確到像素級別的「哪裡是路哪裡是車」
Pose Estimation/姿態估計 識別人體各關節的位置,用於動作捕捉、健身 AI
Neural Style Transfer 把一張圖的藝術風格轉移到另一張圖上,如把照片變梵谷畫風
Image Captioning 自動幫圖片寫說明文字
VQA/視覺問答 看圖回答問題,「這張圖裡有幾個人?」
Instance Segmentation/實例分割 比語義分割更進一步,同類別的不同個體也能分開
Video Understanding/視頻理解 看懂影片裡在幹嘛,理解動作、場景和時序
Image Generation/圖像生成 從文字描述生成全新圖像,Stable Diffusion、Midjourney、DALL-E
Diffusion Model/擴散模型 現在圖像生成的主力架構,從雜訊中一步步還原出圖片,Stable Diffusion 的底層
Multimodal Learning/多模態學習 同時處理文字、圖像、音頻的 AI,GPT-4o 就是
Inpainting/局部重繪 指定圖片中的一塊區域讓 AI 重新生成,修圖神器
ControlNet 精確控制圖像生成的姿勢、構圖、邊緣,讓 AI 畫圖不再全靠運氣

🗣️ 語音與語言(13)
#

術語 說明
NLP/自然語言處理 讓電腦理解、生成、操作人類語言的整個技術領域
Machine Translation/機器翻譯 自動翻譯,Google Translate、DeepL 背後的核心
Speech Recognition/語音識別 把說的話轉成文字(STT),Whisper 是目前最強的開源模型
TTS/語音合成 把文字變成說話聲音,現在已經很難和真人分辨
POS Tagging/詞性標註 幫每個詞標上詞性,是很多 NLP 任務的前處理
NER/命名實體識別 從文字裡抓出人名、地名、組織名
Information Extraction/信息抽取 從非結構化文字裡提取結構化資訊,如關係、事件
Question Answering/問答系統 自動回答自然語言問題
Text Summarization/摘要生成 長文自動壓縮成重點
Sentiment Analysis/情感分析 判斷文字是正面還是負面,客服和品牌監控常用
Knowledge Graph/知識圖譜 用節點和邊表示概念間的關係,Google 知識卡片就是這個
Word Embedding/詞嵌入 把詞變成向量,語意相近的詞在空間中也相近,Word2Vec 是經典
Emotion Recognition/情緒識別 從文字、聲音或表情識別具體情緒,如喜怒哀樂

📊 資料分析與預測(20)
#

術語 說明
Regression/回歸 預測連續數值,如房價、銷售額、溫度
Classification/分類 預測資料屬於哪個類別,如垃圾郵件判斷、客戶分群
PCA/主成分分析 最常見的線性降維方法
Dimensionality Reduction/降維 高維資料壓成低維,保留關鍵資訊去掉雜訊
Feature Engineering/特徵工程 從原始資料中手動挑出對模型有用的特徵,傳統 ML 的核心技能
Feature Extraction/特徵提取 深度學習的優勢:自動從原始資料找特徵,不用人工
K-Means Clustering 最常見的聚類算法,把資料分成 K 群
Clustering/聚類 把相似資料自動分群,不需要預先定義類別
Decision Tree/決策樹 像流程圖一樣的分類器,簡單直觀好解釋,也好向主管說明
Time Series Analysis/時間序列分析 分析按時間排列的資料,找趨勢和週期
Trend/趨勢 資料長期變化的方向
Seasonality/季節性 資料的週期性規律,如每年同期的模式
Forecasting/預測 根據歷史資料預測未來,如銷售預測、需求預測
Collaborative Filtering/協同過濾 「和你相似的人也喜歡這個」,Netflix 和電商推薦背後的邏輯
Content-Based Filtering/內容過濾 根據物品本身特徵推薦,「你喜歡動作片,所以推薦動作片」
Anomaly Detection/異常檢測 找出不正常的資料點,用於詐騙偵測、設備監控
Outlier Detection/離群值檢測 找出統計上偏離太遠的資料點
Random Forest/隨機森林 很多棵決策樹投票,比單棵樹準且穩定
Hybrid Recommendation/混合推薦 兩種推薦方式合體,取各自優點
Distributed Representations 用一組數字描述一個詞的各種特性,而不是只給它一個編號。Word2Vec 就是這個概念

有新詞會繼續加。