使用SPSS找出重複值

更新於 發佈於 閱讀時間約 3 分鐘

找出重複值可以幫助我們瞭解數據集中是否有重複記錄。重複記錄可能是由於數據收集過程中的錯誤或疏忽而造成的。例如,在填寫問卷時,一個人可能會多次填寫相同的資訊,這將導致重複記錄。

重複記錄可能影響分析結果的準確性和可靠性。例如,在統計分析中,重複記錄可能會使平均值、標準差等統計量的計算結果失真。同時,重複記錄也可能導致模型過度擬合而對於新數據的預測能力降低。

因此,在數據分析之前,找出重複值並刪除重複記錄是很重要的。這樣可以確保數據集是干凈的,並可以得到更準確、可靠的分析結果。

有許多原因可能導致資料中出現「重複的」觀察值,例如:

  • 資料輸入錯誤,以致於無意中重複輸入相同的觀察值。
  • 多個觀察值共用同一個主要 ID 值,但次要 ID 值並不一樣,例如,住在一起的家庭成員。


在SPSS中找出重複值的方法如下:

若要識別並標示重複的觀察值

  1. 從功能表中選擇:資料 > 識別重複的觀察值 ...
  2. 選取一個或多個識別觀察值的變數。
  3. 選取「要建立的變數」群組中的一個或多個選項。您可以選擇性地:
  4. 選取一個或多個變數,將組內觀察值依選取的配對觀察值變數排序。 這些變數所定義的排序順序會決定每一組內的「第一」和「最後」觀察值。 否則,將使用原始檔案順序。
  5. 自動過濾掉重複的觀察值,使其不會包含在報告、圖表或統計量的計算內。
  6. 主要觀察值的指標。 建立一個變數;對於所有唯一觀察值和每一組相符觀察值中被識別為主要觀察值的觀察值,將此變數值設為 1,對於每一組內的非主要重複值,將此變數值設為 0。
  • 主要觀察值可以是每個相符組內的最後或第一個觀察值,由相符組內的排序順序決定。 如果不指定任何排序變數,就由原始檔案順序決定每一組內的觀察值順序。
  • 您可以利用指標變數作為過濾變數,將非主要重複值排除在報表和分析外,而不須將這些觀察值從資料檔中刪除。

本範例中,我們想看所有受試者是不是有重複填答,所以透過電子信箱來檢視

raw-image

如下圖。結果出現PrimaryLast變項,就是以重複出現最後一次的資料為主要(1),其他為重複(0),可以透過增減排序來統整看重複值和主要值。之後我們只針對選擇主要值作為觀察值,排除重複值

raw-image


留言
avatar-img
留言分享你的想法!
avatar-img
教育心理博士的筆記本
254會員
144內容數
文章內容以圖像式和步驟化方式,教您如何在各種統計軟體中(例如:SPSS、R和Mplus),執行多種統計方法。此外,我還會分享一些學術和科技新知,幫助您在學術之路上走得更順利。
2024/11/28
以前,若多因子的變異數分析的變異數同異質性假設未通過,那麼變異數分析的F值就會有所誤差,也沒有適當的無母數統計可以替代。最近,有學者提倡Welch-James統計量,這種方法相較於傳統的方差分析更具有穩健性,並且同樣可以檢驗因子主效應和交互作用。通過一些實際案例,我們展示瞭如何在R語言中使用本方法。
Thumbnail
2024/11/28
以前,若多因子的變異數分析的變異數同異質性假設未通過,那麼變異數分析的F值就會有所誤差,也沒有適當的無母數統計可以替代。最近,有學者提倡Welch-James統計量,這種方法相較於傳統的方差分析更具有穩健性,並且同樣可以檢驗因子主效應和交互作用。通過一些實際案例,我們展示瞭如何在R語言中使用本方法。
Thumbnail
2024/05/01
高低分組,顧名思義,就是把考生的成績分成兩組:表現最好的一組和表現最差的一組。依據Kelley(1939),通常前27%的考生是高分組,後27%的考生是低分組。如果高分組和低分組的表現差異很大,那麼說明這題題目鑑別度高,能有效區分不同程度的考生。
Thumbnail
2024/05/01
高低分組,顧名思義,就是把考生的成績分成兩組:表現最好的一組和表現最差的一組。依據Kelley(1939),通常前27%的考生是高分組,後27%的考生是低分組。如果高分組和低分組的表現差異很大,那麼說明這題題目鑑別度高,能有效區分不同程度的考生。
Thumbnail
2023/11/23
Groupmean centering是一種常用的資料預處理方法,特別是多層次分析,若要使用Rights & Sterba (2019)(2019) 發展出R2 (R&S),要對需要將層次1的變項和交互作用都 Groupmean centering。本文介紹使用R和SPSS操作方法
Thumbnail
2023/11/23
Groupmean centering是一種常用的資料預處理方法,特別是多層次分析,若要使用Rights & Sterba (2019)(2019) 發展出R2 (R&S),要對需要將層次1的變項和交互作用都 Groupmean centering。本文介紹使用R和SPSS操作方法
Thumbnail
看更多
你可能也想看
Thumbnail
常常被朋友問「哪裡買的?」嗎?透過蝦皮分潤計畫,把日常購物的分享多加一個步驟,就能轉換成現金回饋。門檻低、申請簡單,特別適合學生與上班族,讓零碎時間也能創造小確幸。
Thumbnail
常常被朋友問「哪裡買的?」嗎?透過蝦皮分潤計畫,把日常購物的分享多加一個步驟,就能轉換成現金回饋。門檻低、申請簡單,特別適合學生與上班族,讓零碎時間也能創造小確幸。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
題目敘述 題目會給定一個整數陣列nums,原本裡面包含有整數1到n,但是中間不小心出了差錯,導致有一個數字消失了,而另一個數字重複了。 請找出重複的數字以及消失的數字,並且 以陣列的形式[重複的數字, 消失的數字]返回這兩個數字。 例如: [1,3,3,4] 消失的數字是2,重複的數字是
Thumbnail
題目敘述 題目會給定一個整數陣列nums,原本裡面包含有整數1到n,但是中間不小心出了差錯,導致有一個數字消失了,而另一個數字重複了。 請找出重複的數字以及消失的數字,並且 以陣列的形式[重複的數字, 消失的數字]返回這兩個數字。 例如: [1,3,3,4] 消失的數字是2,重複的數字是
Thumbnail
情境描述 小明身為Linux系統工程師, 目前接到一個緊急任務, 需要在客戶端確保csv表的某個欄位的值不能重複, 對於軟體工程師來說只要寫個程式就能夠解決, 但客戶端並沒有相關的程式語言啊! 這時候只能夠使用現成的工具來完成,而經驗老道的我們很快就想到了解決方法, 不要急, 就讓我們一步
Thumbnail
情境描述 小明身為Linux系統工程師, 目前接到一個緊急任務, 需要在客戶端確保csv表的某個欄位的值不能重複, 對於軟體工程師來說只要寫個程式就能夠解決, 但客戶端並沒有相關的程式語言啊! 這時候只能夠使用現成的工具來完成,而經驗老道的我們很快就想到了解決方法, 不要急, 就讓我們一步
Thumbnail
成對的數字裡出現一個落單的邊緣人,我有六種方法找出它,你會幾種呢?
Thumbnail
成對的數字裡出現一個落單的邊緣人,我有六種方法找出它,你會幾種呢?
Thumbnail
之前在三招移除重複資料的教學,介紹了用三種方式來把工作表上的重複資料移除,各自有各自適合的場景,其實還有一招是 Apps Script 上可以操作的,就是今天要介紹的 removeDuplicates() 這個方法(method)。
Thumbnail
之前在三招移除重複資料的教學,介紹了用三種方式來把工作表上的重複資料移除,各自有各自適合的場景,其實還有一招是 Apps Script 上可以操作的,就是今天要介紹的 removeDuplicates() 這個方法(method)。
Thumbnail
題目會給我們一個輸入陣列,長度為n+1。 陣列裡面會有n+1個數字,數字的範圍從1到n 裡面恰好有一個數字重複出現,要求我們找出那個重複的數字。 題目要求只能使用常數空間O(1),並且限制不能修改陣列內容。
Thumbnail
題目會給我們一個輸入陣列,長度為n+1。 陣列裡面會有n+1個數字,數字的範圍從1到n 裡面恰好有一個數字重複出現,要求我們找出那個重複的數字。 題目要求只能使用常數空間O(1),並且限制不能修改陣列內容。
Thumbnail
建立序號或稱流水號情境百百種,今天的情境是,不同組別序號就要重新編列,這樣的序號如何快速建立呢? 其實用對函數,不用30秒就解決了!!!先花1分鐘看一下教學影片吧,觀看影片之前可以先下載檔案,學中做、做中學效果最好唷。(文末有函數說明) 檔案下載 函數說明 ✍🏾COUNTIF有條件計數
Thumbnail
建立序號或稱流水號情境百百種,今天的情境是,不同組別序號就要重新編列,這樣的序號如何快速建立呢? 其實用對函數,不用30秒就解決了!!!先花1分鐘看一下教學影片吧,觀看影片之前可以先下載檔案,學中做、做中學效果最好唷。(文末有函數說明) 檔案下載 函數說明 ✍🏾COUNTIF有條件計數
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News