使用SPSS找出重複值

更新 發佈閱讀 3 分鐘

找出重複值可以幫助我們瞭解數據集中是否有重複記錄。重複記錄可能是由於數據收集過程中的錯誤或疏忽而造成的。例如,在填寫問卷時,一個人可能會多次填寫相同的資訊,這將導致重複記錄。

重複記錄可能影響分析結果的準確性和可靠性。例如,在統計分析中,重複記錄可能會使平均值、標準差等統計量的計算結果失真。同時,重複記錄也可能導致模型過度擬合而對於新數據的預測能力降低。

因此,在數據分析之前,找出重複值並刪除重複記錄是很重要的。這樣可以確保數據集是干凈的,並可以得到更準確、可靠的分析結果。

有許多原因可能導致資料中出現「重複的」觀察值,例如:

  • 資料輸入錯誤,以致於無意中重複輸入相同的觀察值。
  • 多個觀察值共用同一個主要 ID 值,但次要 ID 值並不一樣,例如,住在一起的家庭成員。


在SPSS中找出重複值的方法如下:

若要識別並標示重複的觀察值

  1. 從功能表中選擇:資料 > 識別重複的觀察值 ...
  2. 選取一個或多個識別觀察值的變數。
  3. 選取「要建立的變數」群組中的一個或多個選項。您可以選擇性地:
  4. 選取一個或多個變數,將組內觀察值依選取的配對觀察值變數排序。 這些變數所定義的排序順序會決定每一組內的「第一」和「最後」觀察值。 否則,將使用原始檔案順序。
  5. 自動過濾掉重複的觀察值,使其不會包含在報告、圖表或統計量的計算內。
  6. 主要觀察值的指標。 建立一個變數;對於所有唯一觀察值和每一組相符觀察值中被識別為主要觀察值的觀察值,將此變數值設為 1,對於每一組內的非主要重複值,將此變數值設為 0。
  • 主要觀察值可以是每個相符組內的最後或第一個觀察值,由相符組內的排序順序決定。 如果不指定任何排序變數,就由原始檔案順序決定每一組內的觀察值順序。
  • 您可以利用指標變數作為過濾變數,將非主要重複值排除在報表和分析外,而不須將這些觀察值從資料檔中刪除。

本範例中,我們想看所有受試者是不是有重複填答,所以透過電子信箱來檢視

vocus|新世代的創作平台

如下圖。結果出現PrimaryLast變項,就是以重複出現最後一次的資料為主要(1),其他為重複(0),可以透過增減排序來統整看重複值和主要值。之後我們只針對選擇主要值作為觀察值,排除重複值

vocus|新世代的創作平台


留言
avatar-img
教育心理博士的筆記本
273會員
144內容數
文章內容以圖像式和步驟化方式,教您如何在各種統計軟體中(例如:SPSS、R和Mplus),執行多種統計方法。
2024/11/28
以前,若多因子的變異數分析的變異數同異質性假設未通過,那麼變異數分析的F值就會有所誤差,也沒有適當的無母數統計可以替代。最近,有學者提倡Welch-James統計量,這種方法相較於傳統的方差分析更具有穩健性,並且同樣可以檢驗因子主效應和交互作用。通過一些實際案例,我們展示瞭如何在R語言中使用本方法。
Thumbnail
2024/11/28
以前,若多因子的變異數分析的變異數同異質性假設未通過,那麼變異數分析的F值就會有所誤差,也沒有適當的無母數統計可以替代。最近,有學者提倡Welch-James統計量,這種方法相較於傳統的方差分析更具有穩健性,並且同樣可以檢驗因子主效應和交互作用。通過一些實際案例,我們展示瞭如何在R語言中使用本方法。
Thumbnail
2024/05/01
高低分組,顧名思義,就是把考生的成績分成兩組:表現最好的一組和表現最差的一組。依據Kelley(1939),通常前27%的考生是高分組,後27%的考生是低分組。如果高分組和低分組的表現差異很大,那麼說明這題題目鑑別度高,能有效區分不同程度的考生。
Thumbnail
2024/05/01
高低分組,顧名思義,就是把考生的成績分成兩組:表現最好的一組和表現最差的一組。依據Kelley(1939),通常前27%的考生是高分組,後27%的考生是低分組。如果高分組和低分組的表現差異很大,那麼說明這題題目鑑別度高,能有效區分不同程度的考生。
Thumbnail
2023/11/23
Groupmean centering是一種常用的資料預處理方法,特別是多層次分析,若要使用Rights & Sterba (2019)(2019) 發展出R2 (R&S),要對需要將層次1的變項和交互作用都 Groupmean centering。本文介紹使用R和SPSS操作方法
Thumbnail
2023/11/23
Groupmean centering是一種常用的資料預處理方法,特別是多層次分析,若要使用Rights & Sterba (2019)(2019) 發展出R2 (R&S),要對需要將層次1的變項和交互作用都 Groupmean centering。本文介紹使用R和SPSS操作方法
Thumbnail
看更多
你可能也想看
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
題目會給我們一個輸入陣列,長度為n+1。 陣列裡面會有n+1個數字,數字的範圍從1到n 裡面恰好有一個數字重複出現,要求我們找出那個重複的數字。 題目要求只能使用常數空間O(1),並且限制不能修改陣列內容。
Thumbnail
題目會給我們一個輸入陣列,長度為n+1。 陣列裡面會有n+1個數字,數字的範圍從1到n 裡面恰好有一個數字重複出現,要求我們找出那個重複的數字。 題目要求只能使用常數空間O(1),並且限制不能修改陣列內容。
Thumbnail
之前在三招移除重複資料的教學,介紹了用三種方式來把工作表上的重複資料移除,各自有各自適合的場景,其實還有一招是 Apps Script 上可以操作的,就是今天要介紹的 removeDuplicates() 這個方法(method)。
Thumbnail
之前在三招移除重複資料的教學,介紹了用三種方式來把工作表上的重複資料移除,各自有各自適合的場景,其實還有一招是 Apps Script 上可以操作的,就是今天要介紹的 removeDuplicates() 這個方法(method)。
Thumbnail
成對的數字裡出現一個落單的邊緣人,我有六種方法找出它,你會幾種呢?
Thumbnail
成對的數字裡出現一個落單的邊緣人,我有六種方法找出它,你會幾種呢?
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
在 Python 中,集合(Set)是一種重要的資料結構,它提供了一個無序、不可重複元素的集合容器。Set 具有強大的數學運算功能,並且在處理需要去除重複元素或進行成員檢查的情況下非常有用。
Thumbnail
在 Python 中,集合(Set)是一種重要的資料結構,它提供了一個無序、不可重複元素的集合容器。Set 具有強大的數學運算功能,並且在處理需要去除重複元素或進行成員檢查的情況下非常有用。
Thumbnail
題目敘述 題目會給定一個整數陣列nums,原本裡面包含有整數1到n,但是中間不小心出了差錯,導致有一個數字消失了,而另一個數字重複了。 請找出重複的數字以及消失的數字,並且 以陣列的形式[重複的數字, 消失的數字]返回這兩個數字。 例如: [1,3,3,4] 消失的數字是2,重複的數字是
Thumbnail
題目敘述 題目會給定一個整數陣列nums,原本裡面包含有整數1到n,但是中間不小心出了差錯,導致有一個數字消失了,而另一個數字重複了。 請找出重複的數字以及消失的數字,並且 以陣列的形式[重複的數字, 消失的數字]返回這兩個數字。 例如: [1,3,3,4] 消失的數字是2,重複的數字是
Thumbnail
建立序號或稱流水號情境百百種,今天的情境是,不同組別序號就要重新編列,這樣的序號如何快速建立呢? 其實用對函數,不用30秒就解決了!!!先花1分鐘看一下教學影片吧,觀看影片之前可以先下載檔案,學中做、做中學效果最好唷。(文末有函數說明) 檔案下載 函數說明 ✍🏾COUNTIF有條件計數
Thumbnail
建立序號或稱流水號情境百百種,今天的情境是,不同組別序號就要重新編列,這樣的序號如何快速建立呢? 其實用對函數,不用30秒就解決了!!!先花1分鐘看一下教學影片吧,觀看影片之前可以先下載檔案,學中做、做中學效果最好唷。(文末有函數說明) 檔案下載 函數說明 ✍🏾COUNTIF有條件計數
Thumbnail
亂數是要做什麼用的?生活中其實有很多有關亂數的事,例如說:樂透摸彩、抽籤、驚喜包、中獎者、擲骰子等等都是跟亂數有關哦!它們都是將所有的數都丟進去一個空間裡再隨機抽取,在不重複的狀況下每一個數抽到的機率都是一樣的。 在程式中也有這個玩法哦!但是說是這麼說到底怎麼用,咱們來看看: 語法: 在隨機抽取的時
Thumbnail
亂數是要做什麼用的?生活中其實有很多有關亂數的事,例如說:樂透摸彩、抽籤、驚喜包、中獎者、擲骰子等等都是跟亂數有關哦!它們都是將所有的數都丟進去一個空間裡再隨機抽取,在不重複的狀況下每一個數抽到的機率都是一樣的。 在程式中也有這個玩法哦!但是說是這麼說到底怎麼用,咱們來看看: 語法: 在隨機抽取的時
Thumbnail
情境描述 小明身為Linux系統工程師, 目前接到一個緊急任務, 需要在客戶端確保csv表的某個欄位的值不能重複, 對於軟體工程師來說只要寫個程式就能夠解決, 但客戶端並沒有相關的程式語言啊! 這時候只能夠使用現成的工具來完成,而經驗老道的我們很快就想到了解決方法, 不要急, 就讓我們一步
Thumbnail
情境描述 小明身為Linux系統工程師, 目前接到一個緊急任務, 需要在客戶端確保csv表的某個欄位的值不能重複, 對於軟體工程師來說只要寫個程式就能夠解決, 但客戶端並沒有相關的程式語言啊! 這時候只能夠使用現成的工具來完成,而經驗老道的我們很快就想到了解決方法, 不要急, 就讓我們一步
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News