【Linux疑難雜症】Linux如何快速檢查csv某個欄位值是否重複

2024/12/19 更新2023/12/19 發佈閱讀 2 分鐘

情境描述

小明身為Linux系統工程師，目前接到一個緊急任務，需要在客戶端確保csv表的某個欄位的值不能重複，對於軟體工程師來說只要寫個程式就能夠解決，但客戶端並沒有相關的程式語言啊！這時候只能夠使用現成的工具來完成，而經驗老道的我們很快就想到了解決方法，不要急，就讓我們一步步說明完畢後再來細說解決方法。

首先我們假設csv表會有這樣的資料如下，欄位包含名字、年齡、Email資訊：

Name,Age,Email
John,25,john@example.com
...

那麼假設我們今天想要針對csv表進行合併，那麼欄位的標頭已經固定的情境之下，為了確保合併的「名字」不要重複時，我們可以怎麼檢查呢？

表格內容

test.csv

Name,Age,Email
John,25,john@example.com
Amy,26,amy@example.com
John,25,john@example.com

檢查「Name」欄位是否重複

我們會用到的招式有「剪欄位、排序、重複」，對應到Linux的指令有「cut、sort、uniq」，透過這三個工具的組合技巧就能夠讓我們快速檢測出欄位值是否有重複。

使用「cut」擷取特定欄位

這邊我們要擷取的是第一欄

cut -d ',' -f 1 test.csv

結果

Name
John
Amy
John

使用「sort」排序這些值

cut -d ',' -f 1 test.csv|sort

結果

Amy
John
John
Name

使用「uniq」來顯示重複值

-d 選項告訴 uniq 只顯示重複的值。

cut -d ',' -f 1 test.csv | sort | uniq -d

結果

John

結語

原來許多小技巧的文字處理都能夠直接用原生的Linux功能處理，當越來越多的大型系統都使用Linux作業系統時，我們也應該具備一些強大的工具技能，就讓我們慢慢的掌握這些小技巧吧！

#Linux

#作業系統

阿Han的沙龍阿Han的軟體技術棧 💡作業系統

留言

阿Han的沙龍

155會員

331內容數

哈囉，我是阿Han，是一位 👩‍💻 軟體研發工程師，喜歡閱讀、學習、撰寫文章及教學，擅長以圖代文，化繁為簡，除了幫助自己釐清思路之外，也希望藉由圖解的方式幫助大家共同學習，甚至手把手帶您設計出高品質的軟體產品。

阿Han的沙龍的其他內容

2024/12/04

【Linux疑難雜症】The SUID sandbox helper binary was found…

當我們在Ubuntu下載 cursor 這套編輯工具並進行以下步驟安裝時： sudo apt-get install libfuse2 chmod +x cursor-0.42.5x86_64.AppImage ./cursor-0.42.4x86_64.AppImage sudo mv

2024/12/04

【Linux疑難雜症】The SUID sandbox helper binary was found…

當我們在Ubuntu下載 cursor 這套編輯工具並進行以下步驟安裝時： sudo apt-get install libfuse2 chmod +x cursor-0.42.5x86_64.AppImage ./cursor-0.42.4x86_64.AppImage sudo mv

2024/06/25

【Docker疑難雜症】orphan containers …被孤立的容器

咦！怎麼啟動個docker compose up -d就出現了可疑的訊息： +] Running 2/2d orphan containers ([xxxx]) for this project. If you removed or renamed this service in your

2024/06/25

【Docker疑難雜症】orphan containers …被孤立的容器

咦！怎麼啟動個docker compose up -d就出現了可疑的訊息： +] Running 2/2d orphan containers ([xxxx]) for this project. If you removed or renamed this service in your

2023/11/21

【Linux疑難雜症】Bash腳本將執行指令記到LOG檔並同時輸出於螢幕的tee

我們在進行Linux作業時，常常會撰寫一些腳本來進行我們的任務，而我們執行任務當下假如沒有將當時的參數紀錄起來常常事後追朔時很容易就遺漏掉，尤其是在AI模型訓練這一塊，每次的訓練都是好幾個小時甚至好幾天⏱️⏱️⏱️，我們常常會需要對模型訓練的參數與結果進行分析，那麼蛛絲馬跡就非常重要了，

2023/11/21

【Linux疑難雜症】Bash腳本將執行指令記到LOG檔並同時輸出於螢幕的tee

看更多

你可能也想看

哈斯的煉金工房

投資海外市場就選玉山證券！！玉山證券「小額債」體驗分享 ⛰️

對於害怕風險、擔心賠錢的投資新手，本文介紹債券投資的優勢，說明其風險相對可控、能定期領息的特性，並介紹玉山「小額債」如何以低門檻（1,000美元/澳幣起）提供投資者參與海外債市的機會，強調其低波動、固定收益的友善特點，適合有明確時間目標的資金規劃。

#理財#債券#報酬

2026/02/11

哈斯的煉金工房

投資海外市場就選玉山證券！！玉山證券「小額債」體驗分享 ⛰️

#理財#債券#報酬

2026/02/11

理財好好玩

【一位CFP的日常】打造穩定現金流，不必冒進：小額債的投資思維

本文深入探討債券投資的本質、常見迷思、風險控制方法，並詳細介紹玉山證券「小額債」平臺的特色與優勢，包括低門檻、24hr即時報價、精準篩選等，幫助投資人建立理性、有紀律的債券投資策略，打造穩定的現金流，讓金錢成為財務上的助力。

#CFP#投資#財務

2026/03/13

理財好好玩

【一位CFP的日常】打造穩定現金流，不必冒進：小額債的投資思維

#CFP#投資#財務

2026/03/13

黛•Adele的生活隨筆

自由工作者的理財筆記｜第一次嘗試小額債就上手，打造多元資產配置｜玉山證券小額債券

自由工作者收入不穩定，適合選擇穩健的小額債做資產配置。玉山證券小額債最低一千美金就能開始，支援 24 小時委託下單與即時報價，並提供多條件篩選找到適合的債券。本文分享我的操作體驗與為何小額債能成為自由工作者的安心配置。

#小額債#玉山證券#債券投資

2026/02/10

黛•Adele的生活隨筆

自由工作者的理財筆記｜第一次嘗試小額債就上手，打造多元資產配置｜玉山證券小額債券

#小額債#玉山證券#債券投資

2026/02/10

艾比小劇場

不用每天盯盤，也能讓資產慢慢長大

為什麼「小額債券」會成為越來越多人關注的選項？如果你跟我一樣，經歷過股市大漲的甜、也嚐過劇烈修正的苦，大概就會慢慢明白一件事—— 投資，不只是追求報酬，更是關於「穩定感」。很多投資新手一開始進市場，很容易把全部資金都丟進股票，漲的時候很快樂，跌的時候卻發現自己根本睡不好。這

2026/03/14

2026/03/14

【Linux疑難雜症】Linux如何快速檢查csv某個欄位值是否重複

情境描述小明身為Linux系統工程師，目前接到一個緊急任務，需要在客戶端確保csv表的某個欄位的值不能重複，對於軟體工程師來說只要寫個程式就能夠解決，但客戶端並沒有相關的程式語言啊！這時候只能夠使用現成的工具來完成，而經驗老道的我們很快就想到了解決方法，不要急，就讓我們一步

#Linux#作業系統

2023/12/19

阿Han的沙龍

【Linux疑難雜症】Linux如何快速檢查csv某個欄位值是否重複

#Linux#作業系統

2023/12/19

LeetCode King

136. Single Number (只出現一次的數字)

成對的數字裡出現一個落單的邊緣人，我有六種方法找出它，你會幾種呢？

#leetcode#刷題#筆記

2023/12/19

LeetCode King

136. Single Number (只出現一次的數字)

成對的數字裡出現一個落單的邊緣人，我有六種方法找出它，你會幾種呢？

#leetcode#刷題#筆記

2023/12/19

Marcos的方格子

Troubleshooting Linux Servers | sadservers | 刷題記錄 | Easy

Easy共有九題，所有難度總共有75題，慢慢更新中。

#sadservers#Troubleshooting#Linux

2023/12/16

Marcos的方格子

Troubleshooting Linux Servers | sadservers | 刷題記錄 | Easy

Easy共有九題，所有難度總共有75題，慢慢更新中。

#sadservers#Troubleshooting#Linux

2023/12/16

Jeremy Ho的沙龍

PY 筆記 | Data Structure

Basic python data structure

#Python

2023/12/04

Jeremy Ho的沙龍

PY 筆記 | Data Structure

Basic python data structure

#Python

2023/12/04

Meiko微課頻道的沙龍

[VBA]【下拉清單】《不重複》、《無空白》且《可排序》的製作方法

利用 VBA 製作一個【無重複】、【無空白】、【可排序】的下拉清單。

#Meiko微課頻道#下拉清單#ExcelVBA

2023/12/02

Meiko微課頻道的沙龍

[VBA]【下拉清單】《不重複》、《無空白》且《可排序》的製作方法

利用 VBA 製作一個【無重複】、【無空白】、【可排序】的下拉清單。

#Meiko微課頻道#下拉清單#ExcelVBA

2023/12/02

喜特先生官方沙龍

removeDuplicates()：移除重複資料

之前在三招移除重複資料的教學，介紹了用三種方式來把工作表上的重複資料移除，各自有各自適合的場景，其實還有一招是 Apps Script 上可以操作的，就是今天要介紹的 removeDuplicates() 這個方法（method）。

#喜特先生#GoogleAppsScript#AppsScript

2023/10/23

喜特先生官方沙龍

removeDuplicates()：移除重複資料

#喜特先生#GoogleAppsScript#AppsScript

2023/10/23

LeetCode King

389. Find the Difference (找不同)

班上闖來了一個陌生人！該如何快狠準揪出他？這道經典考題的解法，遠比你想的還要多種 ......

#leetcode#刷題#筆記

2023/10/02

LeetCode King

389. Find the Difference (找不同)

班上闖來了一個陌生人！該如何快狠準揪出他？這道經典考題的解法，遠比你想的還要多種 ......

#leetcode#刷題#筆記

2023/10/02

效率基地

EXCEL 如何依據不同類別分別建立序號或流水號

建立序號或稱流水號情境百百種，今天的情境是，不同組別序號就要重新編列，這樣的序號如何快速建立呢? 其實用對函數，不用30秒就解決了!!!先花1分鐘看一下教學影片吧，觀看影片之前可以先下載檔案，學中做、做中學效果最好唷。(文末有函數說明) 檔案下載函數說明 ✍🏾COUNTIF有條件計數

#效率職人#小技巧#EXCEL

2023/09/13

效率基地

EXCEL 如何依據不同類別分別建立序號或流水號

#效率職人#小技巧#EXCEL

2023/09/13

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News