必學 AI 關鍵字 002｜一文看懂大語言模型（LLM）

《必學 AI 關鍵字》是由 AI服務商 EgentHub 建立的AI學習系列，協助企業員工在學習 AI 時遇到艱深的詞彙時，在面對大量繁雜的專業術語時，能快速查找、理解概念，像一本隨手可用的 AI 字典。

上一篇我們提到生成式 AI 能協助撰寫文章、統整文件、潤飾簡報內容等，而許多人往往會把生成式 AI 與大語言模型（Large Language Model, LLM）視為同義詞。事實上，兩者並非完全相同：生成式 AI 是所有「能創造內容的 AI 技術」的總稱，而 LLM 則是其中專門處理語言理解與文字生成的模型類型。

本文將帶你釐清兩者的關係與差別，並進一步解釋大型語言模型（LLM）究竟如何理解語言、如何生成文字。內容會從自然語言處理（NLP）的基礎概念出發，一步步帶你走進 token、Embedding、Transformer、自注意力機制、預訓練與微調等核心機制，讓這些看似艱深的詞彙變得容易理解。

學習提醒： 本文涉及多項 NLP 與 LLM 的核心概念。如果你對 LLM、NLP、token、Embedding、Fine-tuning 等名詞還不熟悉，建議先建立基本印象，再回頭研讀會更容易吸收。

生成式 AI（Gen AI）與大語言模型（LLM）的關係

生成式 AI（Generative AI）是一個廣義概念，只要是能創造文本、圖像、聲音、影片等內容的 AI 技術都屬於生成式 AI。而 LLM（Large Language Model）則是其中專門負責語言相關任務的一支。

可以這樣理解兩者的關係：

生成式 AI 是整個領域
LLM 是其中專注「文字生成」的模型種類

依生成內容的不同，會使用不同的模型：

文字生成： 大語言模型（LLM）—如 GPT、Claude、Gemini
圖像生成： 影像擴散模型、影像生成模型—如 Midjourney、DALL·E
影片生成： 影片擴散模型與影片生成模型—如 Sora、Veo
聲音生成： 文字轉語音模型、聲音生成模型—如 ElevenLabs、Suno

之所以大家容易把「生成式 AI = LLM」混為一談，是因為目前主流 AI 服務多以語言生成為核心功能（ChatGPT、Claude、Gemini），使得 LLM 看起來就像生成式 AI 的代名詞，但實際上兩者仍是「包含與被包含」的階層。

LLM 之前：自然語言處理（NLP）是什麼？

在討論 LLM 如何運作之前，必須先理解它所建立的基礎：自然語言處理（NLP, Natural Language Processing）。

NLP 是人工智慧的一大領域，核心目標是讓電腦能理解、分析並處理人類語言。它結合了語言學、統計方法與電腦科學。其實我們天天都在使用 NLP 技術：

機器翻譯： Google 翻譯能掌握文法結構並產生通順語句
智能客服與聊天機器人： 能辨識我們的問題並給予回應
文本分類： 垃圾郵件偵測、自動分類郵件
輸入法建議： 打字時自動推薦符合上下文的詞語

然而，早期 NLP 系統依賴較多人工規則和較小資料集，因此在語意歧義、上下文判斷上表現有限。這也是後來大型語言模型（LLM）要解決的核心挑戰。

ChatGPT Image 2025年11月18日下午11_57_43.png

LLM：從語言理解到語言生成

若說 NLP 建立了語言處理的規則與架構，那麼大型語言模型（LLM）就在此基礎上，以「規模」與「深度學習」讓機器真正具備語言生成能力。

LLM 的本質是一個巨大的統計預測模型。透過海量資料的訓練，它學會語言中的模式、語義與知識。其運作可拆成三個主要階段：

1. 轉換文字：Tokenization 與 Embeddings

電腦無法直接理解「字」，因此第一步是把文字轉換成數值。

Tokenization（詞元化）

把文字切成較小的單位 token
→ 可能是一個字、一個詞、一個詞根

小提醒：token ≠ 字
10 萬 tokens 不代表 10 萬字。

Embeddings（向量化）

每個 token 會被轉換成一個高維度向量，用數字來表示其語義。相似意思的詞在向量空間中會彼此靠近。

常見的向量運算例子：

向量("國王") - 向量("男性") + 向量("女性") ≈ 向量("女王")

這說明模型能透過向量捕捉抽象關係，如性別、地點、物件功能等。

2. 理解上下文：Transformer 與自注意力機制（Self-Attention）

單看詞元會失去語意脈絡，因此 LLM 必須能理解「上下文」。這正是 Transformer 模型的革命性突破。

自注意力機制透過三個元素協助模型捕捉語境：

Query（查詢）： 問題的方向
Key（鍵）： 詞語的身分標籤
Value（值）： 詞語代表的語義內容

模型會讓每個詞語的 Query 與其他 Key 計算關聯程度（即注意力分數），再依據分數加權 Value，以得出該詞在上下文中的真實含義。

例子：

句子：「我喜歡蘋果手機，因為它很好用。」

模型會讓「它」的 Query 與所有 Key 逐一比較
→ 發現與「蘋果手機」的 Key 匹配度最高
→ 得出「它」的真正含義是「蘋果手機」

這就是 LLM 能理解語境的主因。

3. 模型訓練：從通才到專家

LLM 的能力來自多階段訓練：

▸ 預訓練（Pre-training）

在巨量資料集上學習語言規律、事實知識
目標：預測下一個詞或被遮蔽的詞
成果：一個知識廣泛的 Foundation Model

▸ 微調（Fine-tuning）

在特定領域的小型資料集上進一步調整
使模型更懂某一專業（法律、醫療、財務等）

▸ 人類反饋強化學習（RLHF）

人工標註者對模型輸出評分
模型依評分改善與人類溝通的方式
使其更安全、合乎邏輯、更符合人類偏好

與 AI 共同創造的新階段

從 NLP 的語言規則，到 Transformer 的架構突破，再到 LLM 的深度理解與生成能力，我們見證了 AI 在語言處理上的巨大跨越。LLM 並非取代 NLP，而是將它的能力推向前所未有的高度。未來 NLP 與 LLM 將持續融合，引導我們進入更智慧、更高效的應用時代。

而在企業情境中，專業的AI Agent服務商 EgentHub是台灣 AI 企業應用首選，同時，EgentHub 亦是支援 MCP串接的企業級 AI Agent 管理平台，除了協助企業員工無痛自建AI Agents ，幫助企業將流程、知識與角色轉化，亦提供完整的權限管理機制，真正協助企業讓 AI 落地。

EgentHub

EgentHub的AI閱讀筆記

EgentHub 發表在痞客邦留言(0) 人氣( 6 )

全站分類：生活綜合
個人分類： AI 學習

▲top

請先登入以發表留言。

EgentHub的AI閱讀筆記