AI 術語多到一個程度,連從業者也不見得全懂。
按角色分了 11 區,直接跳區就好。
| 🐣 剛入門 | 聽過但沒搞懂的那些 |
| 💬 日常使用 | 每天在問 AI,但覺得它可以更聽話 |
| 🏢 企業導入 | 老闆問你 AI 怎麼落地,你需要這些詞 |
| 🔧 產品開發 | 在串 API、搞 RAG、或把 AI 包成產品 |
| 🛡️ 安全與倫理 | 越強的工具,越需要知道怎麼出事 |
| ⚡ 效能與成本 | 跑得動和跑得起是兩回事 |
| 🔬 訓練與學習 | 模型怎麼從白紙變成現在這樣 |
| 🧠 架構與評估 | 神經網路長什麼樣,怎麼知道學得好不好 |
| 🖼️ 圖像與多媒體 | 看圖、生圖、改圖 |
| 🗣️ 語音與語言 | 聽得懂人話、說得出人話 |
| 📊 資料分析與預測 | 有資料就能預測,不用猜 |
🐣 剛入門(20) #
| 術語 | 說明 |
|---|---|
| AI/人工智慧 | 不是機器人,是讓電腦學會「判斷」的技術。你每天在用,只是沒發現 |
| Neural Network/神經網路 | 模仿人腦神經元的數學結構,是現在幾乎所有 AI 的底層 |
| Machine Learning/機器學習 | 電腦不靠人寫規則,自己從資料裡找規律。餵越多資料,通常越聰明 |
| Parameters/參數 | 模型裡面有幾十億到幾兆個「可調整的數字」,這些數字決定它怎麼回答。參數越多,能學的東西越多。GPT-4 有超過一兆個 |
| Weights/權重 | 參數的另一個說法。兩個詞常混著用,差別在 Weights 強調的是「已經訓練好的那組數字」 |
| Compute/算力 | 跑 AI 需要的計算資源,主要靠 GPU,是 AI 軍備競賽的核心燃料 |
| Singularity/奇點 | 假設中 AI 智能超越全人類的那個時間點,有人覺得快了,有人覺得根本不會來 |
| AGI/通用人工智慧 | AI 界的終極目標:像人一樣能學任何事。現在還沒到,但大家都在衝 |
| Deep Learning/深度學習 | 機器學習的進化版,靠多層神經網路疊出來的,「深」說的是層數很多 |
| Deepfake/深偽 | AI 換臉換聲的偽造技術,真假越來越難分,已經是社會問題 |
| Scaling Laws/規模法則 | 資料越多、算力越大,模型就越聰明——這個規律目前還大致成立,但在放緩 |
| LLM/大語言模型 | ChatGPT、Claude、Gemini 背後的東西,用海量文字訓練出來的超大模型 |
| Token/標記 | AI 讀文字的最小單位,大概是半個英文字或半個中文詞,你的帳單按它計費 |
| Foundation Model/基礎模型 | 先用海量資料練出通才,再針對各種任務微調,現在大部分 AI 都是這個路數 |
| Generative AI/生成式 AI | 不只會分類,還會「創作」——寫文章、畫圖、做影片都算 |
| Hallucination/幻覺 | AI 一本正經在胡說八道。它不是在說謊,它真的「以為」自己說對了 |
| Context Window/上下文窗口 | AI 的短期記憶,決定它能「記住」多長的對話。超過就開始忘東忘西 |
| Knowledge Cutoff/知識截斷 | AI 的知識有保鮮期,截止日之後的事它一概不知,問最新消息記得搭配搜尋 |
| Open Weights/開放權重 | 模型權重公開,你可以下載來自己跑,不用付費,如 Llama |
| Proprietary Model/閉源模型 | 看不到內部,只能透過 API 付費用,如 GPT-4o、Claude、Gemini |
💬 日常使用(20) #
| 術語 | 說明 |
|---|---|
| Temperature/溫度 | 控制 AI 的「隨機程度」。調高會更有創意但不穩,調低更穩定但容易重複自己 |
| Top-p/核心採樣 | 另一種控制輸出多樣性的旋鈕,通常和 Temperature 只需要調一個 |
| Stop Sequence/停止序列 | 設定一個訊號,AI 看到就停止生成,常用於控制輸出長度 |
| Maximum Length/最大長度 | 限制 AI 回答的 token 數上限,避免它廢話連篇 |
| Zero-shot | 直接問,不給範例。適合簡單任務,複雜的通常要配合 Few-shot |
| Few-shot | 先給幾個例子讓 AI 照著做,準確率和格式一致性通常好很多 |
| In-Context Learning | AI 在對話中透過你給的例子即時學習,不需要重新訓練模型 |
| Prompt/提示詞 | 你對 AI 說的話。同樣的問題換個說法,答案可以差很多 |
| Prompt Engineering/提示工程 | 把問 AI 問題這件事變成一門學問。核心就是說清楚你要什麼 |
| System Prompt/系統提示 | 幫 AI 設定角色和規則的背景指令,通常你看不到,但它一直在影響回答 |
| Persona/人格角色 | 給 AI 一個身份,「你是一個說話很直接的產品經理」,回答風格就會變 |
| Delimiters/分隔符 | 用 ### 或 """ 把指令和內容隔開,讓 AI 不要搞混你在說什麼 |
| Negative Prompt/負面提示 | 告訴 AI「不要出現什麼」,圖像生成常用,也可以用在文字 |
| CoT/思維鏈 | 叫 AI「一步一步想」,邏輯推理能力大幅提升。加一句「Let’s think step by step」就有效 |
| Iterative Prompting | 不要期待第一次就完美,反覆調整指令像雕塑一樣把結果逼出來 |
| Meta-Prompting/元提示 | 讓 AI 幫你寫更好的 Prompt,以子之矛攻子之盾 |
| Tree of Thought/思維樹 | CoT 的進階版,讓 AI 同時探索多條推理路線,挑最好的那條走 |
| Reasoning Model/推理模型 | 會「先想清楚再回答」的模型,數學和邏輯題更強,如 o1、Claude 3.7 |
| Structured Output/結構化輸出 | 強制 AI 回傳 JSON 等固定格式,要串接系統的話幾乎必開 |
| Streaming/串流 | AI 一個字一個字吐出來,不用等全部算完才回,體感速度差很多 |
🏢 企業導入(12) #
| 術語 | 說明 |
|---|---|
| Privacy/隱私 | 你的對話資料會不會被拿去訓練?這是企業導入 AI 最常問的問題之一 |
| Benchmark/基準測試 | 用標準考題評比模型,幫你選出最適合你業務需求的那個 |
| Latency/延遲 | AI 吐出第一個字要多久,使用者感受最直接的效能指標 |
| Throughput/吞吐量 | 系統每秒能服務多少人,決定你能不能 scale |
| Knowledge Base/知識庫 | 餵給 AI 的私房資料,可以是產品手冊、內規、FAQ,AI 只從這裡找答案 |
| Human-in-the-loop | 關鍵步驟讓人類點頭才繼續,適合高風險或需要合規的場景 |
| Fine-tuning/微調 | 讓通用模型針對你的領域變成專家,不是重新訓練,而是在現有基礎上調整 |
| RAG/檢索增強生成 | 讓 AI 先查你的資料庫再回答,解決「AI 不知道公司內部資訊」的問題,企業 AI 最常見的架構 |
| Grounding/實證 | 確保 AI 的每個回答都有來源可查,不是憑空生成,降低幻覺風險 |
| Guardrails/護欄 | 過濾不該說的話,部署在輸入和輸出兩端的安全機制 |
| Local AI/本地端 AI | 模型跑在自己的機器上,不上雲,資料不出去,適合對隱私敏感的產業 |
| Agentic Workflow | 讓 AI 跑完整個流程,不只是回答問題,而是接任務、查資料、執行、交付 |
🔧 產品開發(32) #
| 術語 | 說明 |
|---|---|
| API/應用程式介面 | AI 和其他系統溝通的管道 |
| Metadata/元數據 | 文件的標籤,如日期、作者、部門,用來過濾和排序檢索結果 |
| Short-term Memory/短期記憶 | 當前對話的記錄,關掉就清空 |
| Long-term Memory/長期記憶 | 跨對話的持續記憶,通常需要外部資料庫支援 |
| Embedding/嵌入 | 把文字變成一串數字,讓電腦可以計算兩段話有多「像」,RAG 的基礎 |
| Dense Vector/稠密向量 | 把文字轉成一長串數字,每格都有值,用來捕捉語意。現在主流的嵌入格式 |
| Sparse Vector/稀疏向量 | 一長串數字但大部分是零,只有命中的關鍵字有值。精確但抓不到同義詞 |
| Similarity Score/相似度分數 | 兩段文字在向量空間的距離,越高越相關 |
| Bi-Encoder/雙編碼器 | 兩段文字各自算出向量再比距離,速度快,適合從大量資料裡初步篩選 |
| Cross-Encoder/交叉編碼器 | 把兩段文字一起餵進模型判斷相關度,比 Bi-Encoder 精準但慢很多,適合精篩 |
| Semantic Search/語義搜索 | 搜「費用」也能找到「價格」,因為它找的是語意距離,不是文字完全符合 |
| Sandboxing/沙盒 | 讓 AI 在隔離環境跑程式,出錯不影響正式系統 |
| MoE/混合專家 | 模型裡塞很多「小專家」,每次只啟動相關的幾個,GPT-4 和 Mixtral 都用這招 |
| Vector Database/向量資料庫 | 專門存 Embedding 的資料庫,Pinecone、pgvector、Weaviate、Chroma 都是 |
| Chunking/切塊 | 把長文件切成小段再存進向量庫,切太長找不準,切太短失去脈絡 |
| Document Loader/文檔加載器 | 把 PDF、Word、網頁讀進系統的工具 |
| Text Splitter/文本分割器 | 執行 Chunking 的那個元件 |
| Hybrid Search/混合搜索 | 關鍵字搜索 + 語義搜索一起用,各取優點 |
| Re-ranking/重排序 | 從向量庫撈出候選後再用精確模型篩一遍,準確率更高 |
| Chain/鏈 | 把多個 AI 動作串成線性流程 |
| Agent/智能體 | 能自主規劃下一步、調用工具、執行任務的 AI 程式 |
| Function Calling/函式調用 | 讓 AI 決定何時呼叫哪個外部函式,是 Agent 能動手做事的關鍵 |
| Tool Use/工具使用 | 讓 AI 呼叫外部工具的能力,比 Function Calling 更廣,各家都在推 |
| Action/行動 | AI 對外部世界做的具體操作,如送出 API 請求、寫入資料庫 |
| Skill/技能 | 預先定義好的功能模組,掛上去就能用 |
| Orchestration/編排 | 管理多個 AI 和工具的執行順序,像導演在排戲 |
| Graph/圖架構 | 比鏈更複雜,有分支和循環,適合處理不確定流程 |
| LoRA/低秩適配 | 現在最流行的輕量微調法,只動模型的一小部分參數,便宜又快 |
| MCP/模型上下文協議 | AI 工具整合的標準介面,像 USB 插座,Anthropic 提出,正在快速普及 |
| Multi-Agent/多智能體 | 多個 Agent 分工合作完成任務,2025 最熱的方向之一 |
| Context Engineering/上下文工程 | Prompt Engineering 的進化版。不只管「怎麼問」,而是設計 AI 看到的一切——系統提示、RAG 結果、工具描述、記憶,全部算在內 |
| Harness Engineering/駕馭工程 | 當 AI Agent 大量寫程式時,怎麼用 CI、護欄、規格文件確保品質和安全的系統化做法 |
🛡️ 安全與倫理(14) #
| 術語 | 說明 |
|---|---|
| AI Ethics/AI 倫理 | 研究 AI 的責任歸屬、公平性和社會衝擊,現在還是個很新的領域 |
| Bias/偏見 | 訓練資料有偏,模型就有偏,它可能在你沒注意到的地方歧視某些人 |
| Fairness/公平性 | 讓 AI 對所有人一視同仁,在現實中比說起來難得多 |
| Causal Inference/因果推理 | AI 很會找相關性,但相關不等於因果,這個領域在研究怎麼讓 AI 真正理解因果 |
| Adversarial Attacks/對抗性攻擊 | 對輸入做肉眼看不出的細微修改,讓 AI 做出完全錯誤的判斷 |
| Adversarial Training/對抗性訓練 | 用攻擊樣本訓練讓模型更強健,提前打預防針 |
| XAI/可解釋性 AI | 讓模型說清楚「為什麼做這個決定」,黑箱變透明 |
| Federated Learning/聯邦學習 | 資料不出門也能一起訓練模型,各方只交換學到的參數,隱私方案 |
| Trustworthy AI/可信 AI | 公平、透明、安全、可解釋這四件事都做到,才算「可信」 |
| Alignment/對齊 | 確保 AI 的目標和人類真正想要的一致,聽起來簡單但是 AI 安全研究最難的問題 |
| Red Teaming/紅隊演練 | 請專家扮演攻擊者,主動把 AI 系統的漏洞找出來 |
| Prompt Injection/提示注入 | 把惡意指令藏在輸入裡,誘導 AI 繞過限制做不該做的事 |
| Jailbreaking/越獄 | 用各種手法繞過 AI 的安全限制,讓它說出或做出不該做的事 |
| AI Watermarking/AI 浮水印 | 在 AI 生成的內容裡藏隱形標記,用來判斷是不是 AI 產的 |
⚡ 效能與成本(12) #
| 術語 | 說明 |
|---|---|
| Batch Processing/批處理 | 把多個請求打包一起送,比一個一個送更省資源 |
| Caching/緩存 | 常見問題答案先存起來,直接命中不用重算 |
| Hardware Acceleration/硬件加速 | GPU、TPU 這類專用晶片讓計算快幾十倍 |
| GPU | AI 算力的主力,NVIDIA H100 是目前最搶手的那顆 |
| Cloud Computing/雲端運算 | 彈性擴展、按用量付費,不用自己養硬體 |
| Edge Computing/邊緣計算 | 在裝置本地端算,不用往返雲端,延遲低且資料不外傳 |
| Knowledge Distillation/知識蒸餾 | 大模型的能力「蒸餾」給小模型,讓小模型也能有大模型的部分能力 |
| Pruning/修剪 | 剪掉模型裡用不到的部分,輕量化不失效能 |
| Model Compression/模型壓縮 | 量化、蒸餾、修剪的統稱,目標都是縮小模型 |
| TPU | Google 的 AI 晶片,在 Google Cloud 上用最順 |
| Quantization/量化 | 把模型精度從 32 位壓到 8 位,體積縮小、速度加快,精度略降 |
| Inference Optimization/推理優化 | 讓模型推理變快的各種工程手段 |
🔬 訓練與學習(34) #
| 術語 | 說明 |
|---|---|
| Supervised Learning/監督學習 | 給題目也給答案,讓模型學對應關係,最常見的訓練方式 |
| Unsupervised Learning/無監督學習 | 只給資料不給答案,讓模型自己找結構 |
| Reinforcement Learning/強化學習 | 靠試錯和獎懲學習,AlphaGo 就是這樣練出來的 |
| Loss Function/損失函數 | 衡量模型答錯多少的指標,訓練就是讓它越來越小 |
| Gradient Descent/梯度下降 | 沿著損失函數的斜坡往下走,找最低點就是最佳參數 |
| Learning Rate/學習率 | 每次更新參數的步伐大小,太大跳過最優解,太小學一輩子 |
| Optimization/優化 | 調整參數讓損失函數越來越小的過程 |
| Overfitting/過度擬合 | 模型把訓練集背起來了,但碰到新資料就崩,像只會背答案的學生 |
| Underfitting/欠擬合 | 模型太簡單,連訓練集都學不好 |
| Regularization/正則化 | 防止過擬合的技術,強迫模型不能死記 |
| Training Set/訓練集 | 用來訓練的資料 |
| Validation Set/驗證集 | 訓練中用來調超參數的資料,不算在訓練裡 |
| Test Set/測試集 | 訓練結束才動用,評估模型真實表現 |
| Cross-validation/交叉驗證 | 資料輪流當測試集,比單次分割更可靠地評估模型 |
| Epoch/輪次 | 把全部訓練資料看過一遍算一個 Epoch |
| Batch Size/批次大小 | 每次更新參數用幾筆資料,影響訓練速度和穩定性 |
| Hyperparameter/超參數 | 訓練前要手動設定的參數,如學習率、批次大小,調參就是在調這個 |
| Backpropagation/反向傳播 | 訓練神經網路的核心算法,從輸出誤差反推每層要調整多少 |
| Semi-Supervised Learning/半監督學習 | 少量有標籤 + 大量無標籤混著用,兩者折中 |
| Data Augmentation/資料增強 | 對現有資料做旋轉、裁切等變換,人工把訓練集放大 |
| Transfer Learning/遷移學習 | A 任務學到的知識拿來用在 B 任務,Fine-tuning 是其中一種 |
| Zero-Shot Learning/零樣本學習 | 訓練時沒見過的類別,也能認出來 |
| Domain Adaptation/領域適配 | 解決訓練環境和實際使用環境資料分布不同的問題 |
| Domain Generalization/領域泛化 | 讓模型在從沒見過的新領域也能保持水準 |
| Dropout | 訓練時隨機關掉部分神經元,逼模型不能依賴特定路徑 |
| Batch Normalization | 每一層開始算之前,先把數值調整到差不多的範圍,避免某些數字太大帶歪整個計算 |
| Meta-Learning/元學習 | 「學習如何學習」,讓模型用少量新資料快速適應新任務 |
| Few-Shot Learning/少樣本學習 | 只用幾個例子就能學會新任務,這是訓練策略不只是 Prompt 技巧 |
| Pre-training/預訓練 | 先用海量無標籤資料讓模型學語言,這個階段最貴、最耗算力 |
| Synthetic Data/合成資料 | 用 AI 生成假資料來訓練 AI,解決資料不夠的問題 |
| SFT/監督微調 | 用人類寫好的範例直接教模型,是 Fine-tuning 最基本的操作方式 |
| Instruction Tuning/指令微調 | 讓模型學會「聽指令辦事」,是 ChatGPT 從基礎模型變成對話模型的關鍵步驟 |
| RLHF/人類回饋強化學習 | 人類評分讓模型學什麼樣的回答是好的,ChatGPT 變得「好用」的關鍵 |
| DPO/直接偏好優化 | RLHF 的簡化替代方案,不需要額外訓練獎勵模型,越來越多新模型改用這個 |
🧠 架構與評估(19) #
| 術語 | 說明 |
|---|---|
| Activation Function/激活函數 | 決定神經元要不要「亮起來」的開關。沒有它,神經網路再多層也只是在做加減乘除 |
| Softmax | 把一組分數轉成「各選項的機率」,加起來剛好 100%。模型最後一步常用它來選答案 |
| Accuracy/準確率 | 答對的比例,直觀但資料不平衡時會騙人 |
| Precision/精確率 | 預測是正的裡面,真的是正的比例——「報的準不準」 |
| Recall/召回率 | 真正是正的裡面,找到了多少——「找得全不全」 |
| F1 Score | 同時考慮「報得準不準」和「找得全不全」的綜合分數,兩邊都不能太差 |
| Confusion Matrix/混淆矩陣 | 預測結果和真實結果交叉表,一眼看出哪裡出錯 |
| AUC-ROC | 衡量分類模型整體區分能力,越接近 1 越好 |
| Bayesian Network/貝葉斯網路 | 用圖把「A 會影響 B、B 會影響 C」的機率關係畫出來,擅長處理不確定的情況 |
| Autoencoder/自編碼器 | 把資料壓縮再還原,學會保留最重要的特徵 |
| RNN/循環神經網路 | 擅長序列資料,但有記憶遺忘問題,現在幾乎被 Transformer 取代 |
| LSTM/長短期記憶 | 改良版 RNN,解決了遺忘問題,曾是 NLP 主流 |
| VAE/變分自編碼器 | 學習資料的壓縮表示,可以用來生成新樣本 |
| Seq2Seq/序列到序列 | 輸入一個序列輸出另一個序列,翻譯模型的基礎架構 |
| Attention Mechanism/注意力機制 | 讓模型在處理每個詞時能「看」整個輸入並決定哪些重要,Transformer 的靈魂 |
| Transformer | 現代 AI 的核心架構,2017 年那篇論文之後,幾乎所有 LLM 都是這個底 |
| Self-Attention/自注意力 | 序列中每個位置都能直接看到其他位置,解決了 RNN 遠距離依賴的問題 |
| NAS/神經架構搜索 | 讓 AI 自動找最優網路架構,省去人工試錯 |
| Neuro-Symbolic AI | 神經網路的感知 + 符號邏輯的推理,兩種 AI 路線的合體嘗試 |
🖼️ 圖像與多媒體(18) #
| 術語 | 說明 |
|---|---|
| Computer Vision/電腦視覺 | 讓電腦「看懂」圖片和影片的技術領域 |
| CNN/卷積神經網路 | 圖像處理的主力,能自動提取空間特徵 |
| Face Detection/人臉檢測 | 找到臉在哪裡,但不認識是誰 |
| Object Detection/目標檢測 | 找到圖裡的物體並標出位置,如「左上角有一隻貓」 |
| Face Recognition/人臉識別 | 認出這張臉是誰,用於門禁、解鎖、支付 |
| GANs/生成對抗網路 | 生成器和判別器互相對抗,一個造假一個鑑假,越來越強 |
| Semantic Segmentation/語義分割 | 每個像素都分類,精確到像素級別的「哪裡是路哪裡是車」 |
| Pose Estimation/姿態估計 | 識別人體各關節的位置,用於動作捕捉、健身 AI |
| Neural Style Transfer | 把一張圖的藝術風格轉移到另一張圖上,如把照片變梵谷畫風 |
| Image Captioning | 自動幫圖片寫說明文字 |
| VQA/視覺問答 | 看圖回答問題,「這張圖裡有幾個人?」 |
| Instance Segmentation/實例分割 | 比語義分割更進一步,同類別的不同個體也能分開 |
| Video Understanding/視頻理解 | 看懂影片裡在幹嘛,理解動作、場景和時序 |
| Image Generation/圖像生成 | 從文字描述生成全新圖像,Stable Diffusion、Midjourney、DALL-E |
| Diffusion Model/擴散模型 | 現在圖像生成的主力架構,從雜訊中一步步還原出圖片,Stable Diffusion 的底層 |
| Multimodal Learning/多模態學習 | 同時處理文字、圖像、音頻的 AI,GPT-4o 就是 |
| Inpainting/局部重繪 | 指定圖片中的一塊區域讓 AI 重新生成,修圖神器 |
| ControlNet | 精確控制圖像生成的姿勢、構圖、邊緣,讓 AI 畫圖不再全靠運氣 |
🗣️ 語音與語言(13) #
| 術語 | 說明 |
|---|---|
| NLP/自然語言處理 | 讓電腦理解、生成、操作人類語言的整個技術領域 |
| Machine Translation/機器翻譯 | 自動翻譯,Google Translate、DeepL 背後的核心 |
| Speech Recognition/語音識別 | 把說的話轉成文字(STT),Whisper 是目前最強的開源模型 |
| TTS/語音合成 | 把文字變成說話聲音,現在已經很難和真人分辨 |
| POS Tagging/詞性標註 | 幫每個詞標上詞性,是很多 NLP 任務的前處理 |
| NER/命名實體識別 | 從文字裡抓出人名、地名、組織名 |
| Information Extraction/信息抽取 | 從非結構化文字裡提取結構化資訊,如關係、事件 |
| Question Answering/問答系統 | 自動回答自然語言問題 |
| Text Summarization/摘要生成 | 長文自動壓縮成重點 |
| Sentiment Analysis/情感分析 | 判斷文字是正面還是負面,客服和品牌監控常用 |
| Knowledge Graph/知識圖譜 | 用節點和邊表示概念間的關係,Google 知識卡片就是這個 |
| Word Embedding/詞嵌入 | 把詞變成向量,語意相近的詞在空間中也相近,Word2Vec 是經典 |
| Emotion Recognition/情緒識別 | 從文字、聲音或表情識別具體情緒,如喜怒哀樂 |
📊 資料分析與預測(20) #
| 術語 | 說明 |
|---|---|
| Regression/回歸 | 預測連續數值,如房價、銷售額、溫度 |
| Classification/分類 | 預測資料屬於哪個類別,如垃圾郵件判斷、客戶分群 |
| PCA/主成分分析 | 最常見的線性降維方法 |
| Dimensionality Reduction/降維 | 高維資料壓成低維,保留關鍵資訊去掉雜訊 |
| Feature Engineering/特徵工程 | 從原始資料中手動挑出對模型有用的特徵,傳統 ML 的核心技能 |
| Feature Extraction/特徵提取 | 深度學習的優勢:自動從原始資料找特徵,不用人工 |
| K-Means Clustering | 最常見的聚類算法,把資料分成 K 群 |
| Clustering/聚類 | 把相似資料自動分群,不需要預先定義類別 |
| Decision Tree/決策樹 | 像流程圖一樣的分類器,簡單直觀好解釋,也好向主管說明 |
| Time Series Analysis/時間序列分析 | 分析按時間排列的資料,找趨勢和週期 |
| Trend/趨勢 | 資料長期變化的方向 |
| Seasonality/季節性 | 資料的週期性規律,如每年同期的模式 |
| Forecasting/預測 | 根據歷史資料預測未來,如銷售預測、需求預測 |
| Collaborative Filtering/協同過濾 | 「和你相似的人也喜歡這個」,Netflix 和電商推薦背後的邏輯 |
| Content-Based Filtering/內容過濾 | 根據物品本身特徵推薦,「你喜歡動作片,所以推薦動作片」 |
| Anomaly Detection/異常檢測 | 找出不正常的資料點,用於詐騙偵測、設備監控 |
| Outlier Detection/離群值檢測 | 找出統計上偏離太遠的資料點 |
| Random Forest/隨機森林 | 很多棵決策樹投票,比單棵樹準且穩定 |
| Hybrid Recommendation/混合推薦 | 兩種推薦方式合體,取各自優點 |
| Distributed Representations | 用一組數字描述一個詞的各種特性,而不是只給它一個編號。Word2Vec 就是這個概念 |
有新詞會繼續加。