《必學 AI 關鍵字》是由 AI服務商 EgentHub 建立的AI學習系列,協助企業員工在學習 AI 時遇到艱深的詞彙時,在面對大量繁雜的專業術語時,能快速查找、理解概念,像一本隨手可用的 AI 字典。
上一篇我們提到生成式 AI 能協助撰寫文章、統整文件、潤飾簡報內容等,而許多人往往會把生成式 AI 與大語言模型(Large Language Model, LLM)視為同義詞。事實上,兩者並非完全相同:生成式 AI 是所有「能創造內容的 AI 技術」的總稱,而 LLM 則是其中專門處理語言理解與文字生成的模型類型。
本文將帶你釐清兩者的關係與差別,並進一步解釋大型語言模型(LLM)究竟如何理解語言、如何生成文字。內容會從自然語言處理(NLP)的基礎概念出發,一步步帶你走進 token、Embedding、Transformer、自注意力機制、預訓練與微調等核心機制,讓這些看似艱深的詞彙變得容易理解。
學習提醒: 本文涉及多項 NLP 與 LLM 的核心概念。如果你對 LLM、NLP、token、Embedding、Fine-tuning 等名詞還不熟悉,建議先建立基本印象,再回頭研讀會更容易吸收。

生成式 AI(Gen AI)與大語言模型(LLM)的關係
生成式 AI(Generative AI)是一個廣義概念,只要是能創造文本、圖像、聲音、影片等內容的 AI 技術都屬於生成式 AI。而 LLM(Large Language Model)則是其中專門負責語言相關任務的一支。
可以這樣理解兩者的關係:
- 生成式 AI 是整個領域
- LLM 是其中專注「文字生成」的模型種類
依生成內容的不同,會使用不同的模型:
- 文字生成: 大語言模型(LLM)—如 GPT、Claude、Gemini
- 圖像生成: 影像擴散模型、影像生成模型—如 Midjourney、DALL·E
- 影片生成: 影片擴散模型與影片生成模型—如 Sora、Veo
- 聲音生成: 文字轉語音模型、聲音生成模型—如 ElevenLabs、Suno
之所以大家容易把「生成式 AI = LLM」混為一談,是因為目前主流 AI 服務多以語言生成為核心功能(ChatGPT、Claude、Gemini),使得 LLM 看起來就像生成式 AI 的代名詞,但實際上兩者仍是「包含與被包含」的階層。
LLM 之前:自然語言處理(NLP)是什麼?
在討論 LLM 如何運作之前,必須先理解它所建立的基礎:自然語言處理(NLP, Natural Language Processing)。
NLP 是人工智慧的一大領域,核心目標是讓電腦能理解、分析並處理人類語言。它結合了語言學、統計方法與電腦科學。其實我們天天都在使用 NLP 技術:
- 機器翻譯: Google 翻譯能掌握文法結構並產生通順語句
- 智能客服與聊天機器人: 能辨識我們的問題並給予回應
- 文本分類: 垃圾郵件偵測、自動分類郵件
- 輸入法建議: 打字時自動推薦符合上下文的詞語
然而,早期 NLP 系統依賴較多人工規則和較小資料集,因此在語意歧義、上下文判斷上表現有限。這也是後來大型語言模型(LLM)要解決的核心挑戰。

LLM:從語言理解到語言生成
若說 NLP 建立了語言處理的規則與架構,那麼大型語言模型(LLM)就在此基礎上,以「規模」與「深度學習」讓機器真正具備語言生成能力。
LLM 的本質是一個巨大的統計預測模型。透過海量資料的訓練,它學會語言中的模式、語義與知識。其運作可拆成三個主要階段:
1. 轉換文字:Tokenization 與 Embeddings
電腦無法直接理解「字」,因此第一步是把文字轉換成數值。
Tokenization(詞元化)
把文字切成較小的單位 token
→ 可能是一個字、一個詞、一個詞根
小提醒:token ≠ 字
10 萬 tokens 不代表 10 萬字。
Embeddings(向量化)
每個 token 會被轉換成一個高維度向量,用數字來表示其語義。相似意思的詞在向量空間中會彼此靠近。
常見的向量運算例子:
向量("國王") - 向量("男性") + 向量("女性") ≈ 向量("女王")
這說明模型能透過向量捕捉抽象關係,如性別、地點、物件功能等。
2. 理解上下文:Transformer 與自注意力機制(Self-Attention)
單看詞元會失去語意脈絡,因此 LLM 必須能理解「上下文」。這正是 Transformer 模型的革命性突破。
自注意力機制透過三個元素協助模型捕捉語境:
- Query(查詢): 問題的方向
- Key(鍵): 詞語的身分標籤
- Value(值): 詞語代表的語義內容
模型會讓每個詞語的 Query 與其他 Key 計算關聯程度(即注意力分數),再依據分數加權 Value,以得出該詞在上下文中的真實含義。
例子:
句子:「我喜歡蘋果手機,因為它很好用。」
模型會讓「它」的 Query 與所有 Key 逐一比較
→ 發現與「蘋果手機」的 Key 匹配度最高
→ 得出「它」的真正含義是「蘋果手機」
這就是 LLM 能理解語境的主因。
3. 模型訓練:從通才到專家
LLM 的能力來自多階段訓練:
▸ 預訓練(Pre-training)
在巨量資料集上學習語言規律、事實知識
目標:預測下一個詞或被遮蔽的詞
成果:一個知識廣泛的 Foundation Model
▸ 微調(Fine-tuning)
在特定領域的小型資料集上進一步調整
使模型更懂某一專業(法律、醫療、財務等)
▸ 人類反饋強化學習(RLHF)
人工標註者對模型輸出評分
模型依評分改善與人類溝通的方式
使其更安全、合乎邏輯、更符合人類偏好
與 AI 共同創造的新階段
從 NLP 的語言規則,到 Transformer 的架構突破,再到 LLM 的深度理解與生成能力,我們見證了 AI 在語言處理上的巨大跨越。LLM 並非取代 NLP,而是將它的能力推向前所未有的高度。未來 NLP 與 LLM 將持續融合,引導我們進入更智慧、更高效的應用時代。
而在企業情境中,專業的AI Agent服務商 EgentHub是台灣 AI 企業應用首選,同時,EgentHub 亦是支援 MCP串接的企業級 AI Agent 管理平台,除了協助企業員工無痛自建AI Agents ,幫助企業將流程、知識與角色轉化,亦提供完整的權限管理機制,真正協助企業讓 AI 落地。
請先 登入 以發表留言。