SQL 基礎介紹：DDL、DML、TCL、DCL 與交易管理

Bicky

發佈於電腦科學新手村

更新於 2024/11/26發佈於 2024/11/26閱讀時間約 13 分鐘

^{** 提醒自己要練習 SQL，本篇為作者自學筆記，圖與資源來自各大神和ChatGPT}

SQL（結構化查詢語言）可以按照功能分成四種主要的語言類別，每一類別負責不同的資料庫操作。

1. DDL（Data Definition Language，資料定義語言）

功能： 用來定義資料庫的結構，例如建立、修改或刪除資料表和其他結構。

常見操作：

CREATE：建立新的資料表或資料庫。
ALTER：修改現有的資料表結構。
DROP：刪除資料表或資料庫。
TRUNCATE：清空資料表內容，但保留結構。

例子：（參考 ChatGPT）

建立名為 users 的表格
CREATE TABLE users (
    id INT PRIMARY KEY,
    name VARCHAR(50),
    email VARCHAR(100)
);

-- 新增欄位 age 到 users 表格
ALTER TABLE users ADD age INT;

-- 刪除 users 表格
DROP TABLE users;

2. DML（Data Manipulation Language，資料操作語言）

功能： 用來處理資料庫中的資料，主要是查詢、插入、更新和刪除資料。

常見操作：

SELECT：查詢資料。
INSERT：插入新資料。
UPDATE：更新已存在的資料。
DELETE：刪除資料。

例子：

-- 插入一筆新資料到 users 表格
INSERT INTO users (id, name, email, age)
VALUES (1, 'Alice', 'alice@example.com', 25);

-- 更新 users 表格中 id 為 1 的資料
UPDATE users
SET age = 26
WHERE id = 1;

-- 刪除 users 表格中 age 小於 18 的資料
DELETE FROM users
WHERE age < 18;

3. TCL（Transaction Control Language，交易控制語言）

功能： 用來管理交易（transaction），確保資料的一致性與完整性，常用於多步驟的操作中。

常見操作：

COMMIT：提交交易，使修改永久生效。
ROLLBACK：回復上一個交易，取消之前的修改。
SAVEPOINT：設定交易的保存點，允許回復到某一特定階段。

例子：

-- 開始交易
BEGIN;

-- 插入資料
INSERT INTO users (id, name, email, age)
VALUES (2, 'Bob', 'bob@example.com', 30);

-- 由於發現錯誤，回復交易
ROLLBACK;

-- 重新插入正確的資料
INSERT INTO users (id, name, email, age)
VALUES (2, 'Bob', 'bob.correct@example.com', 30);

-- 提交交易
COMMIT;

4. DCL（Data Control Language，資料控制語言）

功能： 用來控制資料庫的存取權限，保障資料的安全性。

常見操作：

GRANT：授權給使用者特定的操作權限。
REVOKE：收回使用者的操作權限。

例子：

-- 給某使用者讀取和插入資料的權限
GRANT SELECT, INSERT ON users TO 'username';

-- 收回該使用者的插入權限
REVOKE INSERT ON users FROM 'username';

Transaction & ACID (dirty read, non-repeatable read, phantom read)

什麼是交易（Transaction）？

在 SQL 中，交易是一組邏輯操作單位，通常包含多個步驟（如插入、更新、刪除）。交易的目標是確保這些操作要麼全部成功，要麼全部失敗，保證資料的一致性和正確性。

範例：銀行轉帳

假設 A 要轉帳 200 元給 B，這筆交易包含以下兩個步驟：

從 A 的帳戶扣除 200 元。
增加 B 的帳戶 200 元。

為了保證這筆交易的完整性，這兩個步驟必須：

要麼一起成功（完成轉帳）。
要麼一起失敗（如果出錯，A 和 B 的餘額保持原樣）。

ACID 特性

為了設計可靠的交易系統，關聯交易必須具備以下四個特性，稱為 ACID：

1. Atomicity（原子性）

定義：

交易中的所有操作必須視為一個整體（原子單位）。交易是一個大動作，要嘛成功要嘛失敗，沒有成功一半。

若交易成功，所有操作都會執行。
若交易失敗，所有操作都會回復（Rollback），不留下任何痕跡。

例子：

若扣除 A 的 200 元成功，但新增 B 的 200 元失敗，則交易將完全回復，A 的餘額也會回復到初始狀態。

2. Consistency（一致性）

定義：

交易開始前和結束後，資料必須保持一致。換句話說，交易完成後，資料庫的狀態必須符合業務規則和約束條件。

例子：

A 和 B 的總金額在交易前後不能為負。例如：
- 交易前：A = 100 元，B = 100 元。
- 交易後：A = -100 元，B = 200 元。這個狀況就不能成立。

3. Isolation（隔離性）

定義：

多個交易同時進行時，彼此之間的操作不應互相影響。交易在提交前，它的中間狀態對其他交易是不可見的。這會衍伸出

例子：

A 正在轉帳 200 元給 B，這筆交易尚未提交時：
- 其他交易無法看到 A 和 B 的餘額已經改變。
- 只有當這筆交易成功提交後，其他交易才能看到更新後的結果。
Dirty read, non-repeatable read, phantom read 的討論。

假設現在有兩個交易正在進行，如果沒有設計好關聯式資料庫的隔離性就會出現以下問題：

Dirty read：其中一個 Transcation 沒有 commit (完成) 另外一個 Transcation 就讀到了。

Non-repeatable read :　

在同一個 transaction 裡面連續使用相同的 Query 讀取了多次資料，但是相同的 Query 卻回傳了不同的結果，這就是 Non-repeatable reads。Dirty read 也是 non-repeatable read 的一種。

Phantom read:

連續搜尋兩次範圍內的筆數，結果不一樣。如 SELECT ... WHERE時，因為其他交易插入或刪除了符合範圍條件的數據，導致相同範圍查詢在同一交易中執行兩次時，結果不同。

交易 A：正在查詢一個條件範圍內的數據，例如：
SELECT * FROM orders WHERE amount > 100;
查詢結果返回 5 筆資料。
交易 B：在此期間插入了一筆新的資料，其 amount > 100，例如：
INSERT INTO orders (id, amount) VALUES (6, 150);
交易 A：再次執行相同的查詢：
SELECT * FROM orders WHERE amount > 100;
此時查詢結果返回 6 筆資料，比第一次多出了一筆。

小結：

Dirty Read： 一個交易讀取到其他交易未提交的數據，可能會讀到錯誤或不穩定的數據。
Non-Repeatable Read： 在同一交易中，兩次讀取相同條件的資料時，結果不同（通常因其他交易更新或刪除現有數據導致）。
Phantom Read： 兩次範圍查詢時，結果不同（因其他交易新增或刪除符合條件的數據）。

4. Durability（持久性）

定義：

交易提交後，其結果必須永久保存在資料庫中，即使系統發生故障（如斷電、崩潰），提交的數據也不會不見。

例子：

A 成功轉帳 200 元給 B，交易提交後，即使伺服器突然重啟，資料庫中 A 和 B 的餘額仍然正確反映交易結果。

交易的操作指令

在 SQL 中，交易可以使用以下指令進行控制：

BEGIN 或 START TRANSACTION：開始交易。
COMMIT：提交交易，將變更永久保存。
ROLLBACK：回復交易，取消所有操作。
SAVEPOINT：設定保存點，允許回復到特定階段。

為了避免關聯式資料庫出現資料不對稱等問題，在資料庫設計結構時出現「正規化」的要求，拆分資料、消除冗餘、避免異常（例如插入、刪除、更新異常），來確保數據的一致性和完整性。

正規化過程遵循一系列規則（1NF、2NF、3NF 等），每個階段都對表結構有不同的要求。

正規化 Normalization & 反正規化 Denormalization

正規化是分階段進行的，必須先滿足前一階段的要求才能進入下一階段。以下介紹最常用的 1NF、2NF、3NF：

1NF

目標：確保「每個欄位都只能存放一個值」，即消除「重複組」或「多值欄位」。

要求：

表格中的數據是原子性的，每個欄位值不能再進一步分割。
沒有重複的欄位組（row, tuples）。

我們先來看以下的舉例，這份表格哪裡不符合第一正規化（1NF）？

圖片來源：影片 1st, 2nd and 3rd Normal Form (Database Normalisation)

重複的值，解決方式是加上唯一值的 ID 當主鍵。
Order 裡面有多個值，解決方是另外建一個表再連結

2NF

目標：消除「部分依賴」，即所有 key 要完全依賴整個 Primary Key。

要求：

必須先符合 1NF。
所有非Primary Key 欄位必須依賴於「整個 Primary Key」，而不是只有一部份的 Primary Key。

下圖是違反 2NF 的案例Student ID 跟 Course ID 是複合鍵，兩個一組是 Primary Key。但學費（Course Fee）跟 Student ID 沒有關係，所以只有依賴 Course ID。

解決方是一樣是分成兩個表格：

3NF

目標：消除「Transitvie Dependency」，即非主鍵欄位不應依賴於其他非主鍵欄位，每個欄位都要跟主鍵有「直接」關係。

要求：

必須先符合 2NF。
非主鍵欄位只依賴於主鍵，而不能通過其他非主鍵欄位間接依賴。

下圖中，班級名稱和學生ID完全沒有關係，班級名稱是依賴在班級ID上，這就出現Transitvie Dependency 傳遞依賴，我的理解是「間接相關」。

解法：

正規化的壞處是找資料需要連結多個表格，查找效率低弱。於是誕生

反正規化（Denormalization）

例如：訂單表和商品價格表以正規化分開如下

此表由 ChatGPT 生成

如果我們需要查詢訂單的總金額（數量 × 商品價格）需要用JOIN 把兩個表合起來，如果是上千萬筆的電商資料可能就會使查詢效率變慢。

SELECT 
    o.訂單ID, 
    o.客戶ID, 
    o.購買數量 * p.商品價格 AS 總金額
FROM 
    Orders o
JOIN 
    Products p 
ON 
    o.商品ID = p.商品ID;

所以這時候使用反正規化的作法，可以將程式碼節省成

SELECT 訂單ID, 客戶ID, 總金額 FROM Orders WHERE 訂單日期 = '2024-11-25';

小結

正規化的優點：

數據容易維護。
更新只需要更新一個表。

反正規化適用於：

查詢頻繁且要求回復速度的系統。
需要頻繁計算的數據（如總金額、總銷量），而數據更新相對較少的情況。

10會員

54內容數

雙重身份：越南放大鏡 X 下班資工系政大東南亞語言學系是我接觸越南語的起點，畢業後找越南外派工作的生活跟資訊時，發現幾乎都是清單式的分享，很難身歷其境。所以我希望「越南放大鏡」可以帶讀者看到更多細節和深入的觀察。 - 下班資工系則是自學資工系的課程內容，記錄實際操作的過程，學習理論的過程。希望可以跟讀者一起成長。

留言

留言分享你的想法！

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

越南放大鏡 X 下班資工系的其他內容

從 ER 圖到 Schema 的轉換教學

本文將逐步拆解如何將 ER 圖轉換為 Schema，深入瞭解 ER 圖的意義以及其對於資料庫設計的重要性。透過影片內容，我們可以學習如何清晰地描述實體關係，並將複雜的資料結構轉化為易於管理的 Schema 形式。無論是初學者或有經驗的資料庫管理者，都能從中獲得實用的技巧和知識。

#資料結構 #數據 #資料庫

資料庫設計流程

本文探討資料庫設計的基本概念，區別了 Flat-file 和 Database，並詳細介紹了資料庫設計的流程，包括需求分析、ER 圖概念設計、邏輯資料模型和物理模型的轉換。還介紹了關聯式資料庫的基本組成、五大鍵以及各種限制，希望對自學者理解資料庫設計有所幫助。

#結構 #資料結構 #Key

理解進階資料結構（二）：AVL樹｜紅黑樹

前一篇提到B樹和B+樹，這篇介紹AVL 樹和經典的紅黑樹。在開始之前，可以看個輕鬆的影片，對於紅黑樹在真實商業案例的應用更有印象學習資料結構、演算法在工作上真的有用嗎? 實際工作經歷不藏私! | 二元樹 | 雜湊 | 計算機概論 | 工程師 Nic

#紅黑樹 #資料結構 #二元樹

雜湊表（Hash Table）& 字典樹（Trie）的程式碼和補充 Malloc 用法

本文詳細介紹了雜湊表（Hash Table）及雜湊函數（Hash Function）的運作原理與應用，如何解決衝突（Collision）問題，並引入字典樹（Trie）作為另一種資料搜尋結構。透過簡單易懂的比喻和實例，幫助讀者理解這些資料結構的效能和實際用途。

#搜尋 #名字 #抽屜

理解進階資料結構（一）：B樹｜B+樹

樹是資料結構中的核心概念，尤其是當數據量龐大時，選擇適當的樹結構能顯著提升查找和管理效率。本文深入探討了B樹、B+樹、AVL樹及紅黑樹的特性、操作方法及其廣泛應用，並強調選擇自平衡樹的必要性，以確保資料讀取的快速與精確。本文也鼓勵讀者通過動畫學習以便更好地理解這些複雜的樹結構。

#結構 #數據 #搜尋

在 C 語言中使用鏈結串列的優勢

在 C 語言中，陣列的大小固定且使用連續記憶體空間，插入新元素可能不便。鏈結串列則提供了靈活性，可以在不需要連續記憶體的情況下，輕鬆插入新節點。本文將探討陣列與鏈結串列各自的特點，並對比它們在插入與查找操作上的 Big O 複雜度，讓讀者瞭解在不同情境下使用的最佳資料結構選擇。

雜湊表（Hash Table）& 字典樹（Trie）的程式碼和補充 Malloc 用法

#搜尋 #名字 #抽屜

#結構 #數據 #搜尋

你可能也想看

SQL語法修改資料庫 - UPDATE （更新）

已經存在在table裡面的那些record做更新。 ※ 語法 UPDATE [LOW_PRIORITY] [IGNORE] table_name SET column_name1 = expr1, column_name2 = expr2, … [WHERE

上班族簡報日常的沙龍

2024/08/12

數據分析｜只懂用長蛇IF或是VLOOKUP? 數據分類函數運用，製作圖表前先學好EXCEL數據梳理

商業簡報不僅僅是呈現數據，更需要深入瞭解數據分析及有效的工具運用。本文探討於Excel中使用不同函數來改善數據處理效率，包括IF、IFS、VLOOKUP、XLOOKUP及INDEX與MATCH的結合，幫助商業人士更好地從數據中提取洞見，助力業務增值，學習優化數據分析過程，讓您的商業簡報更具影響力。

#數據 #簡報 #商業簡報

奧莉薇走在成為後端工程師之路上

2024/08/08

SQL語法修改資料庫 - INSERT（插入）

※ 把record加到table有兩種方式： VALUES • SELECT ※ 語法 INSERT INTO VALUES 語法： Record 代表一組值的集合，每個值對應到表格中的一個欄位（column）。 INSERT INTO 語法用來指定要插入資料的表格。需要提供一個

奧莉薇走在成為後端工程師之路上

2024/08/01

SQL語法 - TABLE JOIN

※ 何時該使用 JOIN？ JOIN 使用的時機是：當你需要同時查詢一張以上的資料表的時候。 ※ SQL有哪些TABLE JOIN的方式？ INNER JOIN LEFT JOIN RIGHT JOIN SELF JOIN ※ 使用 JOIN 的時候，我們需要考慮到：我要使用哪一種

奧莉薇走在成為後端工程師之路上

2024/07/28

SQL語法 - 別名(ALIAS)

※ 別名：目的在於提高SQL查詢的可讀性和簡潔性。 ※ 別名有兩種： Column Alias（列別名）：在查詢結果中的某一列，取一個臨時的新名字。 Table Alias（表別名）：給查詢中的表取一個短暫的新名字。 ※ Column Alias ※ 為什麼需要 Column A

奧莉薇走在成為後端工程師之路上

2024/07/28

SQL語法 - GROUP BY / HAVING

※ GROUP BY 用於將數據表中的數據按照一個或多個列進行分組。例如在處理一個表格的資料時，可以指定欄位，一個或是多個，然後把將其視為ID進行分組處理。 ※ 語法 SELECT column1, column2, ..., aggregate_function(column) FROM

奧莉薇走在成為後端工程師之路上

2024/07/24

SQL查詢結果 - SELECT （選擇）

※ 語法 SELECT select_list FROM table_name ※ 解析順序 From：從哪裡拿？ SELECT：要 "拿什麼" 資料？ ※ 使用場景： Single column（單一欄位）： Multiple column（多個欄位）： All colu

奧莉薇走在成為後端工程師之路上

2024/07/24

SQL - 資料表 (Table)

※ 關聯式資料庫（RDBMS）是什麼？關聯式資料庫（RDBMS）是一種傳統的資料庫系統，以結構化查詢語言（SQL）為基礎，將資料儲存於預定義的表格中。這些表格包括行和列，彼此之間存在明確的關聯性。 ※ 關聯式資料庫（RDBMS）有兩個重要元素：關聯(Relational)：關聯式資料庫

欸! 是彼得的資料庫

2024/06/20

[SQL]查詢中如何同時orderBy A欄&groupBy B欄?

在進行SQL查詢邏輯更改時，需要適當地使用SubQuery和join來達到新的排序需求。本文將介紹原本的撈取邏輯、需求以及如何使用SubQuery來解決新的排序需求。

#查詢 #subquery #GROUPBY

奧莉薇走在成為後端工程師之路上

2024/08/12

SQL語法修改資料庫 - UPDATE （更新）

已經存在在table裡面的那些record做更新。 ※ 語法 UPDATE [LOW_PRIORITY] [IGNORE] table_name SET column_name1 = expr1, column_name2 = expr2, … [WHERE

上班族簡報日常的沙龍

2024/08/12

數據分析｜只懂用長蛇IF或是VLOOKUP? 數據分類函數運用，製作圖表前先學好EXCEL數據梳理

#數據 #簡報 #商業簡報

奧莉薇走在成為後端工程師之路上

2024/08/08

SQL語法修改資料庫 - INSERT（插入）

SQL語法 - GROUP BY / HAVING

奧莉薇走在成為後端工程師之路上

2024/07/24

SQL查詢結果 - SELECT （選擇）

[SQL]查詢中如何同時orderBy A欄&groupBy B欄?

#查詢 #subquery #GROUPBY

SQL 基礎介紹：DDL、DML、TCL、DCL 與交易管理

1. DDL（Data Definition Language，資料定義語言）

2. DML（Data Manipulation Language，資料操作語言）

3. TCL（Transaction Control Language，交易控制語言）

4. DCL（Data Control Language，資料控制語言）

Transaction & ACID (dirty read, non-repeatable read, phantom read)

什麼是交易（Transaction）？

範例：銀行轉帳

ACID 特性

1. Atomicity（原子性）

2. Consistency（一致性）

3. Isolation（隔離性）

Dirty read：其中一個 Transcation 沒有 commit (完成) 另外一個 Transcation 就讀到了。

Non-repeatable read :

Phantom read:

小結：

4. Durability（持久性）

交易的操作指令

正規化 Normalization & 反正規化 Denormalization

1NF

2NF

3NF

反正規化 （Denormalization）

小結

Non-repeatable read :　

反正規化（Denormalization）