0基礎初探SQL (一)

牧牧

發佈於主題學習

2025/02/17 更新2024/02/18 發佈閱讀 15 分鐘

在這個數據宇宙瀚海中星光熠熠，SQL如同一把通往知識寶庫大門的鑰匙。想像一下，每一條SELECT語句都像是一段魔法咒語，喚醒沉睡在數據庫深處的信息。

啟程地圖

程式語言麻瓜如我，使用下列兩個學習材料以實作探索SQL的應用:

SQL Murder Mystery (https://mystery.knightlab.com/walkthrough.html): 偵探迷的我意外找到這個這個有趣的網站，雖然是全英但內容不複雜，下面的範例也會以這個網站的資料為主。
牛客網 > SQL 非技術快速入門 : 我的訴求是不安裝任何東西，開網頁就能直接寫code, 所以註冊了這個網站會員，使用上很直覺。寫不出來時可以去看一眼其他人怎麼寫的 (旁邊的「解題」提供思路 or 找更快的方式)、題目引導上很細緻，甚至會敘述表格該欄資料代表的意思。
同時，右側執行可以先「自測運行」再提交 (但是他跳錯的提示很rough, 能參考的有限.....還是要自己看)

題目畫面

如果實作中還是困難重重？我還有兩個錦囊妙計：

使用 ChatGPT 4.0 直接詢請AI step by step 教學 (但建議先看完上面資料1 的基礎簡介，最起碼先知道 SELECT, FROM 是什麼)，例如我的prompt: 「我是個小白可以手把手的教我引導我寫這題嗎? 我只有很基礎的SELECT FROM 的知識」
申請外援 哈利波特男友 (aka 其他懂SQL的工程師): 因為看到解題討論中，有許多很fancy的寫法，有些不知是聰明的簡潔還是思慮不周，這時就需要引路人回答。

在這篇文章中，我將一步步揭開：

數據庫和ERD的溫暖擁抱：ERD如何幫助我們親近並理解數據的結構
SQL查詢語句的魔法咒語：讓數據按我們的願望輕聲回答
多表關聯的進階魔法：教你如何引領數據探索更多可能

與我一起踏上這段探秘之旅，從理解Entity Relationship Diagram（ERD）的圖譜開始，學習如何解讀數據之間微妙的聯繫。不僅如此，還將揭開SQL基本查詢指令的神秘面紗，學習如何巧妙地與數據對話！

ERD 實體關係圖 (Entity Relationship Diagram)

探索資料瀚海前總要有個地圖吧？若你有這個想法的話，你可能正在尋找 ERD~

ERD 用於判斷SQL資料集中每個關係，當中有金鑰匙的是primary key,也就是資料中的唯一值，藍色箭頭代表 foreign key會拿來跟不同資料表做交叉對照的唯一值。

例如在person 這張表(entity)當中id 是primary key, 這個primary key可以對應到 facebook_event_check_in這張表當中的person_id, person_id就是foerign key。

schema

*這篇文章中, Column 是欄位，就是上述的部分；Row是列。
中國大陸的用詞欄&列好像是相反的 (?!) 如果有看到簡體的材料需要注意下。

Data Schema 與 ERD?

有接觸過資料分析的人，可能聽過 Data Schema, 但這個詞牧牧幾乎沒聽過通用的中文翻譯(?) 有人叫「資料綱要」或者「數據模式」。ERD 與Data Schema 雖然都用於描述數據庫結構，但它們之間存在一些主要的區別：

表示方式：
- ERD：通過實體（Entity）、關聯（Relationship）和屬性（Attribute）的圖形化表示來描述數據模型。它主要用於數據庫設計的概念階段，幫助設計者和利益相關者理解數據庫結構和業務需求。
- Data Schema：是更為具體的數據組織方式，包括具體的表、字段、數據類型、約束和索引等詳細信息。數據模式通常包含邏輯模式和物理模式，它們分別描述數據庫的邏輯結構和物理存儲方式。
目的和使用階段：
- ERD：主要用於數據庫的設計階段，幫助分析和確定數據間的關係，是一種高層次的、更偏向概念性的模型。它幫助開發者和非技術合作方理解系統的數據結構。
- Data Schema：在ERD的基礎上進一步發展，轉化為具體的數據庫設計和實現細節。它是實際建立和維護數據庫時需要遵循的藍圖。
細節層次：
- ERD：更加抽象，主要關注實體之間的關係，不深入到具體的實現細節，如數據類型或存儲細節。
- Data Schema：包含更多的細節，如數據類型、長度、默認值、索引、約束條件等，是對數據庫結構的具體和詳細描述。

總結來說，ERD是在數據庫設計的早期階段用來幫助理解和規劃數據結構的工具，而數據模式則是更具體、更技術性的描述，用於指導數據庫的實際建立和維護。ERD可以被視為通往詳細數據模式設計的橋樑。

*埋個坑: 哈利波特說, 對於primary key, foreign key的應用同步需要參照index此一概念，但太多index會降低資料效能。

基礎咒語 | 基本規則和概念

SQL 可讀性很高，不一定需要全大寫SELECT ，但通常都會大寫，也可分成多行增加可讀性。查詢的結尾通常有分號;，表示查詢的結束。

SELECT count(*)

FROM person;

示例解釋1

SELECT：用於從資料庫中選擇數據。SELECT後面跟著你想要選擇的列（columns）或者使用*代表選擇所有列。
FROM：指定SELECT語句將要從哪個表格（table）中選擇數據。在此例子中，表格名稱是person。
count()函數：這是一個聚合函數，用於計算表中的行數count(*)會計算表中的總行數，包括所有列中的空值（null values）。
WHERE: (帶下詳細說)

示例解釋2

這行SQL代碼的意思是從person表中選取所有的列，但只返回結果集的前10行。這裡的LIMIT 10用於限制查詢結果的數量，以便只獲取前10條記錄。

SELECT * FROM person LIMIT 10;

初探資料

首次接觸一個資料庫或一個新表時，除了先看資料關係圖 (ERD or Data Schema) 或架構 (database structure, like the ERD) ，看看資料中有哪些數值或種類，初步探勘非常重要，可以了解數據的結構、質量和潛在的分析價值。

下面是一些常見的初步探勘步驟，以及如何檢查哪些列可能含有空值（NULL）的方法。

1. 總行數

首先，確定表中的總行數，可以給你一個基本的數據量感覺：

SELECT COUNT(*) FROM person;

2. 探查屬性與唯一值

唯一值計數：查犯罪報告中，每個唯一值的欄位屬性為何，可使用DISTINCT type。
寫例題的時候也滿常使用的

SELECT DISTINCT type FROM crime_scene_report;

3. 查詢多少非空值

接著，為了檢查哪些列含有空值，可以對每一列進行計數，並與總行數對比。這可以通過對每個欄位使用COUNT(欄位名)來完成，因為COUNT(欄位名)只計數非空的列。

例如，檢查license_id列中有多少非空值：

SELECT COUNT(license_id) FROM person;

如果COUNT(license_id)的結果小於總行數，那麼license_id列中就存在空值。

為了綜合檢查所有列的空值情況，你可以寫一個查詢，對每一列都進行這樣的檢查：

SELECT
    COUNT(id) AS id_non_null,
    COUNT(name) AS name_non_null,
    COUNT(license_id) AS license_id_non_null,
    COUNT(address_number) AS address_number_non_null,
    COUNT(address_street_name) AS address_street_name_non_null,
    COUNT(ssn) AS ssn_non_null
FROM person;

這個查詢會給你每一列非空值的數量。通過與總行數對比，你可以輕易地識別出哪些列包含空值。

其他初步數據探勘

除了檢查空值外，還有幾個其他的初步數據探勘步驟可以給你更深入的數據洞察：

唯一值計數：確定每個列有多少唯一值，可以使用COUNT(DISTINCT 列名)。

SELECT COUNT(DISTINCT name) FROM person;

數據摘要：對於數值型列，計算基本的統計數據，如最小值、最大值、平均值和標準差。

SELECT MIN(address_number), MAX(address_number), AVG(address_number), STDDEV(address_number) FROM person;

分佈情況：了解某些列的分佈情況，如地址或名稱的分佈，可以使用GROUP BY語句和COUNT函數。

SELECT address_street_name, COUNT(*) FROM person GROUP BY address_street_name;

這些步驟可以幫助你建立對數據庫表中數據的基本了解，從而更好地進行後續的分析工作。

常用咒語 | SQL 中的基本元素

SQL中的keyword

除了最常使用的SELECT 和 FROM, 還可以加上其他條件調取資料：

WHERE語句：WHERE是篩選條件，例如下列是使用要從人名(name)的欄位中，篩選出包含下列三個人名的列(使用**IN**)。

SELECT * FROM person WHERE name IN ('Yessenia Fossen', 'Ted Denfip', 'Davina Gangwer');

*上述 WHERE則是篩選條件也可以寫成 OR 但會比較冗長

SELECT * FROM person WHERE name = 'Yessenia Fossen' OR name = 'Ted Denfip' OR name = 'Davina Gangwer';

AND語句: 多條件篩選，例如此處就是去篩選 type欄位中是'theft' (盜竊) 的並且 city 是在 'Chicago' (芝加哥)

SELECT * FROM crime_scene_report
WHERE type = 'theft'
AND city = 'Chicago';

BETWEEN語句: 在SQL中也可以使用 > <等符號，同時也可以使用between

SELECT DISTINCT city
FROM crime_scene_report
WHERE city BETWEEN 'W%' AND 'Z%';

如果搜尋時不確定大小寫的話，也可以使用LOWER(X) 或者 UPPER(X) 幫助搜尋，下列的例子會搜尋 SQL City, 但不一定會依照其大小寫，這樣的轉換原因是 ’提供的是字串，通常會是精準搜尋。

SELECT DISTINCT city 
FROM crime_scene_report 
WHERE LOWER(city) = 'sql city';

模糊匹配: `LIKE`加上 ‘%’ 與 ‘_’ 萬用字元 / 通配符（wildcards）

在SQL中，通配符（wildcards）是用來匹配未知字符的特殊符號，主要用於LIKE語句中實現部分匹配查詢。SQL支持兩種主要的通配符：%和_。

% 通配符

%：代表任意數量的字符（包括零個字符）。當你在查詢字符串中使用%通配符時，SQL會返回所有在該位置匹配任何字符的結果。

例如，查詢LIKE 'Ca%a'可以匹配"Canada"和"California"，因為這些值以"Ca"開頭並以"a"結尾，中間可以是任意數量的字符。

_ 通配符

_：代表恰好一個任意字符。當你在查詢字符串中使用_通配符時，SQL會返回在該位置有任意單一字符的結果。

例如，查詢LIKE 'B_b'會匹配"Bob"和"Bub"，因為這些值在"B"和"b"之間恰好有一個任意字符。但它不會匹配"Babe"（因為中間有兩個字符）或"Bb"（因為中間沒有字符）。

使用通配符時的注意事項

當使用通配符進行模糊匹配時，不能使用等於符號（=），而應該使用LIKE關鍵字。這是因為等於符號用於精確匹配，而LIKE則設計用來與通配符一起使用，實現模糊匹配。

例如，如果你想找到所有名字以"J"開頭的人，你可以使用以下SQL查詢：

SELECT * FROM person WHERE name LIKE 'J%';

這樣，你就可以獲得所有名字以"J"開頭的記錄，無論其後跟隨多少字符。通配符使得SQL查詢更加靈活，能夠應對只知道部分信息的情況。

那如果現在運營團隊想查看所有大學中帶有「北京」的用戶信息，提取相應數據：

SELECT device_id, gender, age, university FROM user_profile
WHERE university LIKE '%北京%';

其他延伸示例

select * from emp where name like '[ac]%';
- 這個查詢使用方括號來定義一個字符集合，它會匹配所有在name列中以'a'或'c'開頭的記錄，後面可以跟隨任意數量的字符。%代表任何數量的字符。
select * from emp where name like '[!ac]%';
- 這個查詢將匹配所有在name列中不以'a'或'c'開頭的記錄，後面可以跟隨任意數量的字符。[!ac]表示“不是'a'或'c'的任何單一字符”。

在MySQL中，會用REGEXP或RLIKE來替代LIKE並使用正則表達式來達成相同的功能。

SQL的學習之路漫漫，通過探索希望你也能把SQL看作是一種溝通方式，一種讓數據說話的技巧，而不僅僅是一堆無機的代碼。希望這篇文章讓你對ERD的視覺語言和SQL查詢的基本節奏有了初步的理解，並開始感知到那些冷冷的數字和指令背後的生命力。

在下一篇文章中，將進一步深化咒語，探索如何利用更多的SQL技巧來進行更高級的數據操縱。我們將學習如何讓數據以更複雜的方式呈現，期待在這個遼闊的數據世界中，帶著探索的熱忱和對數據世界的好奇，讓我們繼續在這片數據的大海裡航行，尋覓著那些尚未發現的知識寶藏！

留言

拾光日誌｜牧牧的沙龍

25會員

52內容數

living a vivid life wholeheartedly 讀萬卷書、行萬里路、見眾生、見自己

拾光日誌｜牧牧的沙龍的其他內容

2025/04/13

250美金4天翻倍！KryptoGo XYZ實測：新手怎麼找標的跟進聰明錢包？

近期美股台股急轉彎，看看迷因幣的表現？想入手的新手歡迎多多討論!

2025/04/13

250美金4天翻倍！KryptoGo XYZ實測：新手怎麼找標的跟進聰明錢包？

近期美股台股急轉彎，看看迷因幣的表現？想入手的新手歡迎多多討論!

2025/03/27

別再只問薪水！面試最後該問的10個關鍵問題，揭開企業文化面紗

職場是人花費時間最多的地方之一，每個人的工作觀不同，有些人尋求成就感、有些人尋求金錢報酬、有些人更在乎穩定和團隊提供的情感價值，而職業的累積更是一場耐力賽，一個人走得快、一群人走得遠，而決定你能否跟一群人走得遠的莫過於團隊氛圍、企業文化！但不論你(的工作觀)是哪一種，文化契合度是能否長跑下去的關鍵

2025/03/27

別再只問薪水！面試最後該問的10個關鍵問題，揭開企業文化面紗

2025/01/26

【完整指南】ETF電子帳單 & 轉匯款銀行申請：以富邦6208為例 (步驟圖解) & ETF重要時間點

這份完整指南將逐步帶你了解如何申請ETF電子帳單以及轉匯款至富邦6208的流程。文章包含詳細步驟圖解，確保你可以輕鬆跟隨操作。同時一文說明白除息日 & 收益分配日，對照中英文名詞！

2025/01/26

【完整指南】ETF電子帳單 & 轉匯款銀行申請：以富邦6208為例 (步驟圖解) & ETF重要時間點

看更多

你可能也想看

奧莉薇走在成為後端工程師之路上

SQL查詢結果 - SELECT （選擇）

※ 語法 SELECT select_list FROM table_name ※ 解析順序 From：從哪裡拿？ SELECT：要 "拿什麼" 資料？ ※ 使用場景： Single column（單一欄位）： Multiple column（多個欄位）： All colu

2024/07/24

奧莉薇走在成為後端工程師之路上

SQL查詢結果 - SELECT （選擇）

2024/07/24

奧莉薇走在成為後端工程師之路上

SQL語法 - WHERE

※ 什麼是WHERE？使用 WHERE來設定條件，可以幫助我們縮小查詢結果的範圍，取得想要的結果。 ※ 語法： ※ 解析順序： From：先看是哪一張table→table裡面符合Where指定條件的record→再看Select指定的是那些欄位→再根據那個欄位進行排序。 ※ 使⽤⽅

2024/07/28

2024/07/28

在這個星光閃爍的數據宇宙中，SQL是一把鑰匙，開啟了通往知識寶庫的大門。想像一下，每一條SELECT語句都像是一段魔法咒語，喚醒沉睡在數據庫深處的信息。今天，我們就要一起踏上這段探秘之旅，將揭開SQL基本查詢指令的神秘面紗，學習如何巧妙地與數據對話。

2024/02/18

2024/02/18

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》，由臺灣劇團「晃晃跨幅町」製作，本文將以從舞台符號、聲音與表演調度切入，討論海妲・蓋柏樂在父權社會結構下的困境，並結合榮格心理學與馮．法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析，理解女人何以走向精神性的操控、毀滅與死亡。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

效率基地

#10 從0到1的POWER QUERY 『取消資料行樞紐』-資料正規化必學神器

在POWER QUERY從0到1 #9 樞紐資料行的功能是將長資料轉換成寬資料，使數據可以快速分析。而所謂的取消資料行樞紐，就是把寬資料轉換成長資料的一個過程，也就是資料的正規化。如下圖所示，左邊的圖為二維結構，屬於寬資料，每列可能包含多筆數據(1.2.3月)，右邊的圖屬於長資料，每列都

#PQ教學#EXCEL#效率職人

2024/01/31

效率基地

#10 從0到1的POWER QUERY 『取消資料行樞紐』-資料正規化必學神器

#PQ教學#EXCEL#效率職人

2024/01/31

喜特先生官方沙龍

QUERY 函式大解析，系列文索引

這邊統整了所有過去發表過關於 QUERY 函式的教學分享，希望可以方便你按照順序閱讀和練習。 QUERY 可以用來查詢、篩選、聚集、排序資料，還可以做張簡易的資料透視表，是我在 Google 試算表上做數據分析、製作報告、製作儀表板時最常用的函式之一，既方便又好用，誠心推薦！

2024/01/30

2024/01/30

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

這是一場修復文化與重建精神的儀式，觀眾不需要完全看懂《遊林驚夢：巧遇Hagay》，但你能感受心與土地團聚的渴望，也不急著在此處釐清或定義什麼，但你的在場感受，就是一條線索，關於如何找著自己的路徑、自己的聲音。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

奧莉薇走在成為後端工程師之路上

SQL語法修改資料庫 - UPDATE （更新）

已經存在在table裡面的那些record做更新。 ※ 語法 UPDATE [LOW_PRIORITY] [IGNORE] table_name SET column_name1 = expr1, column_name2 = expr2, … [WHERE

2024/08/12

奧莉薇走在成為後端工程師之路上

SQL語法修改資料庫 - UPDATE （更新）

已經存在在table裡面的那些record做更新。 ※ 語法 UPDATE [LOW_PRIORITY] [IGNORE] table_name SET column_name1 = expr1, column_name2 = expr2, … [WHERE

2024/08/12

奧莉薇走在成為後端工程師之路上

SQL語法修改資料庫 - INSERT（插入）

※ 把record加到table有兩種方式： VALUES • SELECT ※ 語法 INSERT INTO VALUES 語法： Record 代表一組值的集合，每個值對應到表格中的一個欄位（column）。 INSERT INTO 語法用來指定要插入資料的表格。需要提供一個

2024/08/08

奧莉薇走在成為後端工程師之路上

SQL語法修改資料庫 - INSERT（插入）

2024/08/08

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

《轉轉生》（Re:INCARNATION）為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，結合拉各斯街頭節奏、Afrobeat／Afrobeats、以及約魯巴宇宙觀的非線性時間，建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發，解析其去殖民的身體政治。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11