如何在 JASP 中篩選數據

更新於 發佈於 閱讀時間約 8 分鐘

本篇文章將透過幾個範例,展示如何使用這項新的篩選功能。

JASP 的篩選功能提供了三種介面:點擊篩選器(Click Filter)、拖放篩選器(Drag and Drop Filter)以及 R 篩選器(R Filter)。本文翻譯自JASP部落格文章


點擊篩選器 (Click Filter)

點擊篩選器是一個簡單的篩選介面,用於篩選分類變量。可以通過點擊需要篩選的變量欄位標題來使用。

在第一個範例中,我們將使用數據集「Kitchen Rolls」(Data Library -> Kitchen Rolls),示範如何根據一個或多個分類變量的約束條件進行篩選。假設我們只想分析女性學生的數據。「Kitchen Rolls」包含兩個與此相關的變量:

  • Sex(性別):記錄每位參與者的性別('M' 表示男性,'F' 表示女性)。
  • Student(是否為學生):記錄每位參與者是否為學生('Y' 表示是,'N' 表示否)。

操作步驟如下:

  1. 點擊 Sex 欄位標題,取消勾選 "M",以排除男性參與者的數據。
  2. 然後點擊 Student 欄位標題,取消勾選 "N",以排除非學生的數據。

完成後,數據中只會保留性別為 "F" 且為學生 ("Y") 的行。如果需要清除通過點擊篩選器創建的所有篩選條件,只需點擊右側的橡皮擦圖標即可。


https://jasp-stats.org/2018/06/27/how-to-filter-your-data-in-jasp/

https://jasp-stats.org/2018/06/27/how-to-filter-your-data-in-jasp/


拖放篩選器 (Drag & Drop Filter)

拖放篩選器讓您可以通過簡單的拖放操作來創建篩選條件。在 JASP 中加載數據集或 .jasp 文件後,可以通過點擊數據視圖左上角的篩選圖標來訪問拖放篩選器。


篩選一個或多個分類變量

現在,我們使用拖放篩選器創建與前例相同的篩選條件。在從資料庫加載數據文件後,我們可以如上所述訪問拖放篩選器。接下來,將左側菜單中的 Sex(性別)變量拖入篩選框,並選擇 =。注意,您也可以通過點擊直接添加變量或運算符。然後,點擊公式右側的空白區域,輸入 ‘F’,並按下 Enter。之後,點擊「應用透過篩選器」按鈕 (Apply pass-through filter),這樣篩選後,Sex 欄中只有包含 ‘F’ 的行會保持活躍狀態。

為了篩選出所有女性學生,我們需要在下方添加另一個公式:將 Student(是否為學生)變量拖入篩選框,並選擇 =。接著輸入 ‘Y’,按下 Enter。應用篩選後,我們會看到只剩下滿足 Sex = F 並且 Student = Y 的受試者。

同樣地,例如,如果我們想激活某變量不等於特定值的受試者,可以在篩選中插入 。若需刪除所有通過拖放篩選器創建的篩選條件,只需雙擊垃圾桶圖標並應用即可。

https://jasp-stats.org/wp-content/uploads/2018/06/02_drag_cat.gif

https://jasp-stats.org/wp-content/uploads/2018/06/02_drag_cat.gif


篩選連續變量

接下來,我們將探討如何根據連續變量的等式或不等式約束篩選數據,也就是對「比例」類型的變量使用例如等於、大於或小於等操作。舉例來說,我們將使用數據集「Presents' Height」(資料庫 -> Miscellaneous),該數據集包含每位美國總統的身高比例(即他們的身高與最接近競爭者的身高相比)以及其普選支持率。

假設我們想從連續變量 Heights Ratio(身高比例)中篩選掉所有異常值。實現此操作的一種方法是:

  1. 進入「描述性統計」(Descriptives),點擊「描述性統計」選項(Descriptive Statistics)。
  2. 在「圖表」(Plots)中請求生成箱線圖(Boxplot)。
  3. 勾選箱線圖選項中的「標記異常值」(Label Outliers)。

完成上述操作後,我們可以看到數據中有一個異常值,該值位於第 10 行。此時,您的 JASP 窗口應顯示如下內容:

raw-image

確定異常值的位置後,我們可以進一步篩選掉該異常值。首先,點擊 OK 以退出描述性統計的選單。向下滾動到第 10 行,我們可以看到這位總統的身高比例為 1.18405。同時,我們注意到變量 V1 代表行號,這非常方便,因為我們可以直接基於該變量進行篩選,而無需記住這位總統的具體身高比例。

進入拖放篩選器後,將變量 V1 拖入篩選框中。我們希望篩選器保留該變量中除第 10 行以外的所有值,因此將運算符 ≠ 拖到 V1 的旁邊。然後點擊 ≠ 右側的空白區域,輸入 ‘10’,並按下 Enter。最後,點擊「應用透過篩選器」(Apply pass-through filter),我們會看到第 10 行的數據已被篩選掉。當然,我們也可以直接基於變量 Heights Ratio 進行篩選,使用篩選公式 Heights Ratio ≠ 1.18405。另一種方式是建立「小於/大於」的篩選公式。該異常值的身高比例為 1.18405,但箱線圖顯示其他數據中沒有超過 1.15 的異常值。因此,篩選公式 Heights Ratio < 1.15 也可以達到篩選效果,保留所有身高比例低於 1.15 的數據。

raw-image


R 篩選器 (R Filter)

可以通過點擊拖放篩選器左下角的「R」圖標訪問 R 篩選器。使用 R 篩選器,您可以為數據撰寫自定義篩選條件,這些條件是拖放篩選器無法提供的。此外,您還可以將 R 模式下創建的篩選條件與在變量視窗中選擇的篩選器或拖放篩選器中創建的條件結合使用。

實際上,您可以輕鬆查看由其他篩選器生成的程式碼,這些程式碼顯示在頂部只讀的文本框中,以 generatedFilter <-開頭。例如,保持先前拖放篩選器範例中創建的篩選條件啟用,然後切換到 R 模式,系統會顯示以下介面(頂部顯示生成的篩選條件的 R 語法):

raw-image
raw-image

在程式碼視窗中,您只需輸入目標欄位的名稱即可引用您的數據。JASP 會自動確保其引用正確的數據。如果欄位名稱包含空格,則必須將這些空格一併輸入。若需清除在 R 篩選器中創建的所有篩選條件,只需點擊介面底部的橡皮擦圖標,然後點擊「應用」即可。

以下是幾個範例(前提是您的數據中包含這些欄位):

基於性別和測試分數的篩選

  • 篩選條件:性別為女性且測試分數大於 5: Gender == "Female" & TestScore > 5
  • 在考慮之前透過拖放篩選器或變量視窗創建的篩選條件的基礎上,進行性別和測試分數篩選: generatedFilter & Gender == "Female" & TestScore > 5

按性別分組篩選年齡

  • 篩選條件:年齡小於其性別組別中的平均年齡: (mean(Age) > Age) %|% Sex
  • %|% 運算符 是 JASP 特有的 R 運算符,它確保左側的程式碼會對右側變量的每個組別單獨執行。在上述範例中,篩選條件會針對每個性別分別計算平均年齡,並篩選出低於該性別平均年齡的數據。
  • 注意:確保將條件表達式用括號括起來。例如,以下程式碼將無法按預期運行: mean(Age) > Age %|% Sex 因為這樣只會將年齡按性別進行分組,而平均年齡的計算仍基於整列數據。

R 篩選器的靈活性

雖然拖放篩選器的運算符和功能存在一定限制,但使用 R 模式篩選器的可能性幾乎是無限的。任何以 R 語法表示的篩選條件都可以在 JASP 的 R 篩選器中運行。

avatar-img
230會員
130內容數
文章內容以圖像式和步驟化方式,教您如何在各種統計軟體中(例如:SPSS、R和Mplus),執行多種統計方法。此外,我還會分享一些學術和科技新知,幫助您在學術之路上走得更順利。
留言
avatar-img
留言分享你的想法!

































































心理博士的筆記本 的其他內容
JASP 是一款免費的統計軟體,以其直觀的界面和強大的功能,成為社會科學和人文學科領域研究者的首選,本文將介紹如何使用此軟體。
JASP 是一款免費的統計軟體,以其直觀的界面和強大的功能,成為社會科學和人文學科領域研究者的首選,本文將介紹如何使用此軟體。
本篇參與的主題活動
記錄一場前往屏東縣三地門鄉德文山(觀望山)的登山之旅,分享路線規劃、登山心得、沿途風景與美食體驗,並提醒登山客注意入山證申請及避免錯過三角點。
近期因為大S流感發病離世,朋友們紛紛詢問流感的用藥及營養預防,妞藥師先來聊藥物! 本文探討流感用藥,包含公費藥物易剋冒、克流感及自費藥物紓伏效之比較,並說明預防性投藥的條件及注意事項,下一篇再分享忙碌的現代人如何透過科技營養補充聰明增強抵抗力。
元宵節,不僅是傳統節慶,更蘊含著豐富的歷史文化與民俗活動。本文從辛棄疾的詞作〈青玉案·元夕〉切入,探討元宵節的起源、演變、以及在臺灣地區的特殊節慶習俗,例如鹽水蜂炮、炸寒單等,並穿插燈謎等趣味元素,帶領讀者深入瞭解元宵節的迷人魅力。
嗨大家好!這裡是對錢斤斤計較又貪生怕死的Aurora😂 最近去了人生第一趟東南亞(峇里島), 基於個人對東南亞的一些刻板印象, 所以我在準備行李的時候可說是焦頭爛額, 在此分享一些經驗給有同樣困擾的大家🫶   旅行時間:2025.1.1-2025.1.10,時值峇里島雨季,每天都在下
想提升生產力,卻不知道從何開始?這篇文章分享我多年來愛用的 3 款高效 App:ATracker 幫你一鍵記錄時間流向,讓你清楚掌握作息;專注清單結合番茄鐘工作法,幫助你維持高效專注力;iPhone 內建提醒事項則讓待辦清單管理更容易。這些工具操作簡單、介面簡潔,讓你在新的一年裡,把時間花在刀口上!
記錄一場前往屏東縣三地門鄉德文山(觀望山)的登山之旅,分享路線規劃、登山心得、沿途風景與美食體驗,並提醒登山客注意入山證申請及避免錯過三角點。
近期因為大S流感發病離世,朋友們紛紛詢問流感的用藥及營養預防,妞藥師先來聊藥物! 本文探討流感用藥,包含公費藥物易剋冒、克流感及自費藥物紓伏效之比較,並說明預防性投藥的條件及注意事項,下一篇再分享忙碌的現代人如何透過科技營養補充聰明增強抵抗力。
元宵節,不僅是傳統節慶,更蘊含著豐富的歷史文化與民俗活動。本文從辛棄疾的詞作〈青玉案·元夕〉切入,探討元宵節的起源、演變、以及在臺灣地區的特殊節慶習俗,例如鹽水蜂炮、炸寒單等,並穿插燈謎等趣味元素,帶領讀者深入瞭解元宵節的迷人魅力。
嗨大家好!這裡是對錢斤斤計較又貪生怕死的Aurora😂 最近去了人生第一趟東南亞(峇里島), 基於個人對東南亞的一些刻板印象, 所以我在準備行李的時候可說是焦頭爛額, 在此分享一些經驗給有同樣困擾的大家🫶   旅行時間:2025.1.1-2025.1.10,時值峇里島雨季,每天都在下
想提升生產力,卻不知道從何開始?這篇文章分享我多年來愛用的 3 款高效 App:ATracker 幫你一鍵記錄時間流向,讓你清楚掌握作息;專注清單結合番茄鐘工作法,幫助你維持高效專注力;iPhone 內建提醒事項則讓待辦清單管理更容易。這些工具操作簡單、介面簡潔,讓你在新的一年裡,把時間花在刀口上!
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
商業簡報不僅僅是呈現數據,更需要深入瞭解數據分析及有效的工具運用。本文探討於Excel中使用不同函數來改善數據處理效率,包括IF、IFS、VLOOKUP、XLOOKUP及INDEX與MATCH的結合,幫助商業人士更好地從數據中提取洞見,助力業務增值,學習優化數據分析過程,讓您的商業簡報更具影響力。
Thumbnail
數據分析是現代社會的核心技能,適用於各行各業。無論是在市場營銷、財務管理,還是產品開發中,數據分析都扮演著至關重要的角色。提升數據敏感度有助於提高分析的準確性和效率,使我們能夠迅速找到關鍵信息,進而做出明智的決策。本文將探討數據分析訓練方法,提供實用案例,幫助初學者快速掌握數據分析技術。
Thumbnail
有時候在其他檔案轉換成SPSS檔時,可能出現在一個變項內,以特定符號將不同數字分開的(如下圖,第三行4,7,8),這時無法用SPSS進行有效分析。本文將說明如何使用SPSS將特定符號分開的數字轉換成不同變項,光看文字可能太過抽象,請看圖文教學。
如何在SQL實踐中EXCEL 常用功能 篩選 和 擷取文字串?需要熟練地使用分組(GROUP BY) 與 排序 (ORDER BY) 以及SUBSTRING_INDEX函數!
Thumbnail
這邊統整了所有過去發表過關於 QUERY 函式的教學分享,希望可以方便你按照順序閱讀和練習。 QUERY 可以用來查詢、篩選、聚集、排序資料,還可以做張簡易的資料透視表,是我在 Google 試算表上做數據分析、製作報告、製作儀表板時最常用的函式之一,既方便又好用,誠心推薦!
Thumbnail
你是否曾經遇到這樣的情況?手上有一張表格,需要根據某個欄位進行分類,但表格又很繁雜,如果手動一個個查找,就需要花費大量時間才能找到想要的資料,這樣實在是太沒效率又容易眼花。 今天,我就來教你一個FILTER 函數快速分類技巧,讓你輕鬆掌握數據,節省時間。
Thumbnail
Excel是職場上最常使用的軟體之一,學會Excel的常用技巧可以讓工作效率大幅提升。今天要教大家一個Excel的小技巧,可以一秒自動統計數據,並結合下拉式選單,讓工作更輕鬆。 其他應用:這個技巧還可以應用於其他領域,例如:統計考試成績、統計銷售額、統計客戶數量
Thumbnail
Excel 是辦公室必備的軟體,在處理數據時,常遇到需要快速篩選數據的需求。例如,我們需要將銷售額大於 100 萬的商品列出,以便製作報表。如果手動篩選,不僅費時費力,而且容易出錯。Excel提供了兩個功能幫助快速篩選數據:自動篩選:根據欄位中的值來篩選數據。下拉式選單:讓使用者根據需求來篩選數據。
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
商業簡報不僅僅是呈現數據,更需要深入瞭解數據分析及有效的工具運用。本文探討於Excel中使用不同函數來改善數據處理效率,包括IF、IFS、VLOOKUP、XLOOKUP及INDEX與MATCH的結合,幫助商業人士更好地從數據中提取洞見,助力業務增值,學習優化數據分析過程,讓您的商業簡報更具影響力。
Thumbnail
數據分析是現代社會的核心技能,適用於各行各業。無論是在市場營銷、財務管理,還是產品開發中,數據分析都扮演著至關重要的角色。提升數據敏感度有助於提高分析的準確性和效率,使我們能夠迅速找到關鍵信息,進而做出明智的決策。本文將探討數據分析訓練方法,提供實用案例,幫助初學者快速掌握數據分析技術。
Thumbnail
有時候在其他檔案轉換成SPSS檔時,可能出現在一個變項內,以特定符號將不同數字分開的(如下圖,第三行4,7,8),這時無法用SPSS進行有效分析。本文將說明如何使用SPSS將特定符號分開的數字轉換成不同變項,光看文字可能太過抽象,請看圖文教學。
如何在SQL實踐中EXCEL 常用功能 篩選 和 擷取文字串?需要熟練地使用分組(GROUP BY) 與 排序 (ORDER BY) 以及SUBSTRING_INDEX函數!
Thumbnail
這邊統整了所有過去發表過關於 QUERY 函式的教學分享,希望可以方便你按照順序閱讀和練習。 QUERY 可以用來查詢、篩選、聚集、排序資料,還可以做張簡易的資料透視表,是我在 Google 試算表上做數據分析、製作報告、製作儀表板時最常用的函式之一,既方便又好用,誠心推薦!
Thumbnail
你是否曾經遇到這樣的情況?手上有一張表格,需要根據某個欄位進行分類,但表格又很繁雜,如果手動一個個查找,就需要花費大量時間才能找到想要的資料,這樣實在是太沒效率又容易眼花。 今天,我就來教你一個FILTER 函數快速分類技巧,讓你輕鬆掌握數據,節省時間。
Thumbnail
Excel是職場上最常使用的軟體之一,學會Excel的常用技巧可以讓工作效率大幅提升。今天要教大家一個Excel的小技巧,可以一秒自動統計數據,並結合下拉式選單,讓工作更輕鬆。 其他應用:這個技巧還可以應用於其他領域,例如:統計考試成績、統計銷售額、統計客戶數量
Thumbnail
Excel 是辦公室必備的軟體,在處理數據時,常遇到需要快速篩選數據的需求。例如,我們需要將銷售額大於 100 萬的商品列出,以便製作報表。如果手動篩選,不僅費時費力,而且容易出錯。Excel提供了兩個功能幫助快速篩選數據:自動篩選:根據欄位中的值來篩選數據。下拉式選單:讓使用者根據需求來篩選數據。