方格精選

三招移除重複資料

更新於 發佈於 閱讀時間約 8 分鐘
來出個題目給你:
要怎麼知道售價的總和?簡單,選取 C 欄後看右下角的探索窗格、或是用 SUM 函式取得 C 欄的總和就可以了。可是如果再把這張表看得細一點,你會發現 RR003 這筆資料重複了好幾次!我們以為這次賺了很多錢,但其實這不是正確的總和。
這就是為什麼移除重複資料很重要。重複的資料有可能會讓我們做出錯誤的分析,進而做出錯誤的決定,在進行資料分析之前一定得做的一大步驟。
那麼,這次我會介紹「移除重複」功能UNIQUE條件式格式這三招,幫你甩開重複的資料。我們開始吧!
我把這次用到的試算表放這了,歡迎複製一份拿去練習唷!

「移除重複內容」功能

優缺點

👍 可快速處理大筆資料
👍 可選擇要分析的資料欄
👎 只能處理欄內重複的資料、不能分析列內重複的資料
如果你用這個功能,試算表會幫你留下第一筆資料,並把這之後重複的都移除。另外,這個功能會無視大小寫、一律去除重複的資料(例如「Apple」跟「apple」會被視為一樣的資料)。
打個比方,我想移除下面這張表裡的重複內容:
你可以看到第 12 到第 20 列的資料跟上面的重複了。
我們就來用「移除重複內容」功能,把重複的資料拿掉。選取你的資料範圍(A 欄到 E 欄),再到工具列的「資料」>「移除重複內容」:
會跳出來一個視窗:
如果你的資料有標題列,建議把第一個方塊勾起來,這樣試算表就可以讀到你的標題列,可以更好搜尋:
這邊有個「要分析的資料欄」,預設是全部勾選,這代表試算表會去分析、比對每一欄(A、B、C、D、E)內的資訊。回頭看看這張表:
如果你在剛剛的視窗勾選了全部的方塊,試算表就會以整列為標準來分析資料。這麼一來,第 12 列(編號 A3 的藍妤苓)以後的資料會被視為重複,因為和前面的資料完全一樣。執行結果就會像這樣:
如果在剛剛的視窗只勾選 E 欄的客戶類別,試算表就只會分析 E 欄內是否有重複的資料。這麼一來,就會是這個結果:
你可以依照你的需求,選擇要勾選的欄位,可以多嘗試幾次,看看哪種效果最適合你。

UNIQUE 函式

優缺點

👍 函式簡單、可和其他函式組裝併用
👍 可處理動態資料
👍 可處理列裡的重複資料(需要先轉置)
👎 函式結果不能直接編輯
👎 不能指定要分析的欄位
用了 UNIQUE,試算表一樣會幫你輸出第一筆資料、但結果不能編輯。另外,UNIQUE 不會移除拼字相同、大小寫不同的重複資料,例如「Apple」跟「apple」對 UNIQUE 來說會被視為不一樣的資料。
語法相當單純:
=UNIQUE(要分析的範圍)
我用同一組表格示範:
假設我們想在 G1 產生結果,在儲存格寫下:
=UNIQUE(A:E)
Enter 敲下去,來看看結果!
搞定囉,就這麼簡單!但我想提兩個小缺點,給你斟酌一下:
一:UNIQUE 的結果沒辦法編輯
如果你想要在 UNIQUE 的結果上編輯,會出現 #REF! 錯誤:
這是因為 UNIQUE 會抓取指定範圍內的資料後輸出結果,如果有任何新資料在那,就會擋住 UNIQUE 產生資料了。
二:UNIQUE 不能分析資料欄
就如同你剛剛看到的,UNIQUE 沒有其他設定欄位的參數能輸入。如果你有這個需求,可以考慮「移除重複功能」或是等等會提到的「條件式格式」。

移除單列的重複資料

不過 UNIQUE 還有個很方便的應用方式,它不僅能分析欄、也還能分析列的重複資料!舉例來說:
第二列的蘋果、香蕉、西瓜重複了好幾次。
要怎麼用?因為 UNIQUE 只會回傳裡面唯一的值,而不是,我們得先把列轉置成欄(請參考怎麼欄列互換(轉置)?)。這邊我用 TRANSPOSE 做示範。
在 A5 輸入:
=UNIQUE(TRANSPOSE(A2:H2))
就會得到:
搞定!如果你希望結果是是在列上顯示,你也可以在 UNIQUE 外面再包一層 TRANSPOSE 回去:
=TRANSPOSE(UNIQUE(TRANSPOSE(A2:H2)))
完成!
(2024/06/28 更新)讀者也提供了一個好方法:
=UNIQUE(1:1, 1)
=UNIQUE(1:1, TRUE)
將你想要移除重複資料的列放在第一個參數,並在之後寫上 1 或是 TRUE,這樣也可以喔!

移除多列的重複資料

如果是多列資料要移除呢?
也很簡單,我們只要把所有的值都合併到同一欄位、再丟給 UNIQUE 處理就可以了。這邊會用到 FLATTEN 函式,有了它、就可以把範圍內的值一欄一欄抓起來、再放在一起,就像是 flatten 字面上「攤平」的意思。
先把 A2 到 H10 併到同一欄:
=FLATTEN(A2:H10)
再用 UNIQUE 包起來就好了:
=UNIQUE(FLATTEN(A2:H10))

馬上就能用的組合技

另外,UNIQUE 也常拿來跟 QUERY 或 IMPORTRANGE 綁一起,提供兩份食譜給你參考:
移除 QUERY 的重複結果
=UNIQUE(QUERY(資料!A:D, "SELECT *"))
移除 IMPORTRANGE 的重複結果
=UNIQUE(IMPORTRANGE("https://...", "資料!A:D"))

條件式格式

優缺點

👍 可以細膩搜尋比較,斟酌哪個該刪、哪個不該刪
👍 可用視覺輔助、一有重複就會提醒
👎 面對較大筆的資料容易讓試算表卡住
👎 只能用一個欄作為分析對象
用條件式格式的功能可以讓重複的資料「亮」起來,你可以再依此決定哪筆資料要留、哪筆不要留。我在和同事分享試算表的時候,會在特定的欄上設定條件式格式,這麼一來,如果他們不小心放了重複的資料,他們就會馬上知道了。另外,使用這個功能時,試算表會無視大小寫字母,像是 Apple 跟 apple 都會被視為重複的資料。
不過,我想再提兩個小缺點:
  • 資料筆數較多的時候,條件式格式會稍稍拖慢試算表的處理速度。在執行之前可以看看資料的大小、再考慮一下要不要用這個功能。
  • 條件式格式只能用一個欄作為分析對象,也就不會像是「移除重複內容」一樣可以選定要分析的欄、UNIQUE 可以分析每個欄了。

使用步驟

選取資料範圍,工具列點選「格式」>「條件式格式設定」:
你應該會看到右手邊會出現一個窗格:
在「儲存格符合以下條件時套用指定格式」的下拉式選單裡,選擇「自訂公式:」。
假設我們要找 A 欄裡重複的資料好了。在「值或公式」那邊,我們輸入:
=COUNTIF($A$1:$A1, A1) > 1
來看看效果:
A 欄裡重複的資料「亮」起來了!你也可以繼續編輯你的格式,要變粗體、斜體、加底線、改字體顏色、儲存格顏色都可以。
如果你想要讓整列都出現條件式格式,你可以修改一下剛剛的那串:
=COUNTIF($A$1:$A1, $A1) > 1
執行結果就像這樣:
你就可以從這些亮起來的重複資料裡,手動刪除你不要的了。
如果資料很多、不想一直滑,你可以再搭配篩選器,依顏色篩選,篩選出重複的資料,再手動刪除。
設定篩選器的步驟也很簡單。先選取資料範圍,點選工具列,「資料」>「建立篩選器」:
你會看到第一列的每個儲存格出現了像是倒「三」的圖案。
在你剛剛條件式格式指定的欄位(以這次的例子來說,A 欄),點那個圖案後,選「依顏色篩選」>「填滿顏色」> 你剛剛指定的顏色。
這樣就篩選好了:

綜合比較

感謝你看到這邊!我把今天這三招的優缺點統整成一張表格:
取決你的資料和清除的需求,你可以綜合比較這三個方法,找到一個比較適合的,加油!

如果你喜歡這次的文章,歡迎你透過這些方法支持我:
・按下愛心、按下儲存
・留言告訴我你的想法
・加入喜特先生的官方沙龍,即時看到我發布的教學
・付費訂閱喜特先生的官方沙龍,加入每月小額訂閱方案
・追蹤喜特先生的 Facebook
・按這邊小額贊助我的創作!
想要看更多文章,歡迎來到我的 Notion 頁面找找有沒有你需要的資源喔!
我是喜特先生,Mr. Sheet,我們下個教學見!
avatar-img
14.5K會員
148內容數
簡潔,快速,有效, 讓你的日常生活、工作生產力大提升! ___ 快按「加入」,馬上追蹤所有喜特先生的更新,有 Google 試算表教學、Google Apps Script 的研究、數據分析課程的開箱,還有 Google 試算表疑難雜症的解題分享唷!💪
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
喜特先生官方沙龍 的其他內容
今天來介紹轉置(Transpose),兩招可以讓你輕鬆做好欄列互換 (ノ>ω<)ノ
我用 GOOGLEFINANCE 做了樣版,可以讓你抓股價、找匯率資訊、翻出股票過往的歷史資料,歡迎來看看!
今天要盡力徹底講解 QUERY 的 LIKE,以及實際應用上可以怎麼執行,快快進來 LIKE 一下!
要怎麼無視大小寫,用 QUERY 抓取資料呢?方法其實很簡單,一起看下去吧!
相對參照、絕對參照是新手必定要了解的重要觀念,歡迎來看看瞧瞧唷!
上次說完了 ARRAYFORMULA 的基本原理,這次來看看怎麼應用它們!一起來看看!
今天來介紹轉置(Transpose),兩招可以讓你輕鬆做好欄列互換 (ノ>ω<)ノ
我用 GOOGLEFINANCE 做了樣版,可以讓你抓股價、找匯率資訊、翻出股票過往的歷史資料,歡迎來看看!
今天要盡力徹底講解 QUERY 的 LIKE,以及實際應用上可以怎麼執行,快快進來 LIKE 一下!
要怎麼無視大小寫,用 QUERY 抓取資料呢?方法其實很簡單,一起看下去吧!
相對參照、絕對參照是新手必定要了解的重要觀念,歡迎來看看瞧瞧唷!
上次說完了 ARRAYFORMULA 的基本原理,這次來看看怎麼應用它們!一起來看看!
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
商業簡報不僅僅是呈現數據,更需要深入瞭解數據分析及有效的工具運用。本文探討於Excel中使用不同函數來改善數據處理效率,包括IF、IFS、VLOOKUP、XLOOKUP及INDEX與MATCH的結合,幫助商業人士更好地從數據中提取洞見,助力業務增值,學習優化數據分析過程,讓您的商業簡報更具影響力。
這系列會以實際的資料來教學並練習,這篇資料取自Tableau的 Superstores 裡的Orders工作表,我們在做實際的數據分析以前,想要先來了解自己的資料。第一眼望去,總共有9994筆內容(+1筆欄位名),第一個問題來了,資料筆數會等於總訂單數嗎?更精確地說,到底有多少不重複的訂單?
Thumbnail
資料中如果有特定的內容需要移除,並且是有一定的規則,EXCEL會蠻多種解決方案。 用一個資料進行舉例: 這份資料中每個課程後面都有一個括號備註日期。 如何把括號中的日期快速刪除,分享幾種常見的方法 取代法 剖析法 CTRL+E法 函數法 【💡取代法】 選取資料範圍
※ 什麼是資料庫正規化?為什麼需要正規化? 什麼是資料庫正規化? 資料庫正規化是一種設計關聯式資料庫的方法,目的是建立良好結構的關聯表,主要目的有二: 去除重複性:建立沒有重複的關聯表。因為重複資料不只浪費資料庫的儲存空間,而且會產生資料維護上的問題。 去除不一致的相依性:資料相依是指關聯表
Thumbnail
分頁是EXCEL很棒的一個功能,他可以將不同類型的資料在同一個檔案裏面分開存放,就不需要產出一拖拉庫的檔案。 但是隨著時間或是類型越來越多,分頁數量逐漸上升,分頁要尋找可能就不是一件非常容易的事情。 就要一直點...一直點...一直點.... 上面的範例只是52週的資料而已,有些公司的分頁
Thumbnail
為什麼要比較Excel 工作表(Worksheet) 工作中,常常會儲存多個同一目的,但不同時間的工作。或者,有時要檢查兩個人做的EXCEL工作表,是否有所不同。當然,若工作表很小,肉眼看是最快的,但是,如果是庫存的大量資料如1萬筆以上的財務資訊等,這時靠肉眼看,速度實在是太慢了,而且也容易出錯。
Thumbnail
題目敘述 題目會給定一個pandas DataFrame作為輸入,要求我們以原有的資料表email欄位為比較基準,刪除重複的列 data rows,只保留最早第一次出現的。 題目的原文敘述 Example 1: Input: +-------------+---------+--------
Thumbnail
對於許多企業而言,試算表是日常業務和決策過程中不可或缺的工具。它們被用於各種目的,從財務預算和盈虧分析到庫存管理和客戶數據記錄。然而,隨著業務的發展和數據量的增加,許多人會發現自己面臨著試算表管理和維護的挑戰,這些挑戰可能妨礙效率、準確性和生產力。 1. 數據管理的繁瑣性 試算表中數據的輸入
Thumbnail
開始整理東西後發現自己買太多相同品項的東西,很多都過期。 然後書是很大的問題,如果是紙本書真的是很麻煩,可是現在實在很多爛書,所以幾乎還是以借的為主,買電子書可以大大減低開銷和處理問題。 不看網路廣告和廣告電子報,不衝動購買真的會省很多錢。 到實體店面實際買商品,也增加自己會考慮要不要買和實際
Thumbnail
新的一年來臨,我期望重新檢視我的財務報表,讓自己更輕鬆的管理財務。我希望有一張預算編列表,然後利用這些表格來審視我的預算與到時候實際的收支狀況。我發現許多財務相關的apps都無法滿足我的需求。所以,我親手製作了一個包含預算和實際支出的表格,最後將這兩者合併成一個統一的表格。
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
商業簡報不僅僅是呈現數據,更需要深入瞭解數據分析及有效的工具運用。本文探討於Excel中使用不同函數來改善數據處理效率,包括IF、IFS、VLOOKUP、XLOOKUP及INDEX與MATCH的結合,幫助商業人士更好地從數據中提取洞見,助力業務增值,學習優化數據分析過程,讓您的商業簡報更具影響力。
這系列會以實際的資料來教學並練習,這篇資料取自Tableau的 Superstores 裡的Orders工作表,我們在做實際的數據分析以前,想要先來了解自己的資料。第一眼望去,總共有9994筆內容(+1筆欄位名),第一個問題來了,資料筆數會等於總訂單數嗎?更精確地說,到底有多少不重複的訂單?
Thumbnail
資料中如果有特定的內容需要移除,並且是有一定的規則,EXCEL會蠻多種解決方案。 用一個資料進行舉例: 這份資料中每個課程後面都有一個括號備註日期。 如何把括號中的日期快速刪除,分享幾種常見的方法 取代法 剖析法 CTRL+E法 函數法 【💡取代法】 選取資料範圍
※ 什麼是資料庫正規化?為什麼需要正規化? 什麼是資料庫正規化? 資料庫正規化是一種設計關聯式資料庫的方法,目的是建立良好結構的關聯表,主要目的有二: 去除重複性:建立沒有重複的關聯表。因為重複資料不只浪費資料庫的儲存空間,而且會產生資料維護上的問題。 去除不一致的相依性:資料相依是指關聯表
Thumbnail
分頁是EXCEL很棒的一個功能,他可以將不同類型的資料在同一個檔案裏面分開存放,就不需要產出一拖拉庫的檔案。 但是隨著時間或是類型越來越多,分頁數量逐漸上升,分頁要尋找可能就不是一件非常容易的事情。 就要一直點...一直點...一直點.... 上面的範例只是52週的資料而已,有些公司的分頁
Thumbnail
為什麼要比較Excel 工作表(Worksheet) 工作中,常常會儲存多個同一目的,但不同時間的工作。或者,有時要檢查兩個人做的EXCEL工作表,是否有所不同。當然,若工作表很小,肉眼看是最快的,但是,如果是庫存的大量資料如1萬筆以上的財務資訊等,這時靠肉眼看,速度實在是太慢了,而且也容易出錯。
Thumbnail
題目敘述 題目會給定一個pandas DataFrame作為輸入,要求我們以原有的資料表email欄位為比較基準,刪除重複的列 data rows,只保留最早第一次出現的。 題目的原文敘述 Example 1: Input: +-------------+---------+--------
Thumbnail
對於許多企業而言,試算表是日常業務和決策過程中不可或缺的工具。它們被用於各種目的,從財務預算和盈虧分析到庫存管理和客戶數據記錄。然而,隨著業務的發展和數據量的增加,許多人會發現自己面臨著試算表管理和維護的挑戰,這些挑戰可能妨礙效率、準確性和生產力。 1. 數據管理的繁瑣性 試算表中數據的輸入
Thumbnail
開始整理東西後發現自己買太多相同品項的東西,很多都過期。 然後書是很大的問題,如果是紙本書真的是很麻煩,可是現在實在很多爛書,所以幾乎還是以借的為主,買電子書可以大大減低開銷和處理問題。 不看網路廣告和廣告電子報,不衝動購買真的會省很多錢。 到實體店面實際買商品,也增加自己會考慮要不要買和實際
Thumbnail
新的一年來臨,我期望重新檢視我的財務報表,讓自己更輕鬆的管理財務。我希望有一張預算編列表,然後利用這些表格來審視我的預算與到時候實際的收支狀況。我發現許多財務相關的apps都無法滿足我的需求。所以,我親手製作了一個包含預算和實際支出的表格,最後將這兩者合併成一個統一的表格。