如何在 JASP 中篩選數據

更新於 發佈於 閱讀時間約 8 分鐘

本篇文章將透過幾個範例,展示如何使用這項新的篩選功能。

JASP 的篩選功能提供了三種介面:點擊篩選器(Click Filter)、拖放篩選器(Drag and Drop Filter)以及 R 篩選器(R Filter)。本文翻譯自JASP部落格文章


點擊篩選器 (Click Filter)

點擊篩選器是一個簡單的篩選介面,用於篩選分類變量。可以通過點擊需要篩選的變量欄位標題來使用。

在第一個範例中,我們將使用數據集「Kitchen Rolls」(Data Library -> Kitchen Rolls),示範如何根據一個或多個分類變量的約束條件進行篩選。假設我們只想分析女性學生的數據。「Kitchen Rolls」包含兩個與此相關的變量:

  • Sex(性別):記錄每位參與者的性別('M' 表示男性,'F' 表示女性)。
  • Student(是否為學生):記錄每位參與者是否為學生('Y' 表示是,'N' 表示否)。

操作步驟如下:

  1. 點擊 Sex 欄位標題,取消勾選 "M",以排除男性參與者的數據。
  2. 然後點擊 Student 欄位標題,取消勾選 "N",以排除非學生的數據。

完成後,數據中只會保留性別為 "F" 且為學生 ("Y") 的行。如果需要清除通過點擊篩選器創建的所有篩選條件,只需點擊右側的橡皮擦圖標即可。


https://jasp-stats.org/2018/06/27/how-to-filter-your-data-in-jasp/

https://jasp-stats.org/2018/06/27/how-to-filter-your-data-in-jasp/


拖放篩選器 (Drag & Drop Filter)

拖放篩選器讓您可以通過簡單的拖放操作來創建篩選條件。在 JASP 中加載數據集或 .jasp 文件後,可以通過點擊數據視圖左上角的篩選圖標來訪問拖放篩選器。


篩選一個或多個分類變量

現在,我們使用拖放篩選器創建與前例相同的篩選條件。在從資料庫加載數據文件後,我們可以如上所述訪問拖放篩選器。接下來,將左側菜單中的 Sex(性別)變量拖入篩選框,並選擇 =。注意,您也可以通過點擊直接添加變量或運算符。然後,點擊公式右側的空白區域,輸入 ‘F’,並按下 Enter。之後,點擊「應用透過篩選器」按鈕 (Apply pass-through filter),這樣篩選後,Sex 欄中只有包含 ‘F’ 的行會保持活躍狀態。

為了篩選出所有女性學生,我們需要在下方添加另一個公式:將 Student(是否為學生)變量拖入篩選框,並選擇 =。接著輸入 ‘Y’,按下 Enter。應用篩選後,我們會看到只剩下滿足 Sex = F 並且 Student = Y 的受試者。

同樣地,例如,如果我們想激活某變量不等於特定值的受試者,可以在篩選中插入 。若需刪除所有通過拖放篩選器創建的篩選條件,只需雙擊垃圾桶圖標並應用即可。

https://jasp-stats.org/wp-content/uploads/2018/06/02_drag_cat.gif

https://jasp-stats.org/wp-content/uploads/2018/06/02_drag_cat.gif


篩選連續變量

接下來,我們將探討如何根據連續變量的等式或不等式約束篩選數據,也就是對「比例」類型的變量使用例如等於、大於或小於等操作。舉例來說,我們將使用數據集「Presents' Height」(資料庫 -> Miscellaneous),該數據集包含每位美國總統的身高比例(即他們的身高與最接近競爭者的身高相比)以及其普選支持率。

假設我們想從連續變量 Heights Ratio(身高比例)中篩選掉所有異常值。實現此操作的一種方法是:

  1. 進入「描述性統計」(Descriptives),點擊「描述性統計」選項(Descriptive Statistics)。
  2. 在「圖表」(Plots)中請求生成箱線圖(Boxplot)。
  3. 勾選箱線圖選項中的「標記異常值」(Label Outliers)。

完成上述操作後,我們可以看到數據中有一個異常值,該值位於第 10 行。此時,您的 JASP 窗口應顯示如下內容:

raw-image

確定異常值的位置後,我們可以進一步篩選掉該異常值。首先,點擊 OK 以退出描述性統計的選單。向下滾動到第 10 行,我們可以看到這位總統的身高比例為 1.18405。同時,我們注意到變量 V1 代表行號,這非常方便,因為我們可以直接基於該變量進行篩選,而無需記住這位總統的具體身高比例。

進入拖放篩選器後,將變量 V1 拖入篩選框中。我們希望篩選器保留該變量中除第 10 行以外的所有值,因此將運算符 ≠ 拖到 V1 的旁邊。然後點擊 ≠ 右側的空白區域,輸入 ‘10’,並按下 Enter。最後,點擊「應用透過篩選器」(Apply pass-through filter),我們會看到第 10 行的數據已被篩選掉。當然,我們也可以直接基於變量 Heights Ratio 進行篩選,使用篩選公式 Heights Ratio ≠ 1.18405。另一種方式是建立「小於/大於」的篩選公式。該異常值的身高比例為 1.18405,但箱線圖顯示其他數據中沒有超過 1.15 的異常值。因此,篩選公式 Heights Ratio < 1.15 也可以達到篩選效果,保留所有身高比例低於 1.15 的數據。

raw-image


R 篩選器 (R Filter)

可以通過點擊拖放篩選器左下角的「R」圖標訪問 R 篩選器。使用 R 篩選器,您可以為數據撰寫自定義篩選條件,這些條件是拖放篩選器無法提供的。此外,您還可以將 R 模式下創建的篩選條件與在變量視窗中選擇的篩選器或拖放篩選器中創建的條件結合使用。

實際上,您可以輕鬆查看由其他篩選器生成的程式碼,這些程式碼顯示在頂部只讀的文本框中,以 generatedFilter <-開頭。例如,保持先前拖放篩選器範例中創建的篩選條件啟用,然後切換到 R 模式,系統會顯示以下介面(頂部顯示生成的篩選條件的 R 語法):

raw-image
raw-image

在程式碼視窗中,您只需輸入目標欄位的名稱即可引用您的數據。JASP 會自動確保其引用正確的數據。如果欄位名稱包含空格,則必須將這些空格一併輸入。若需清除在 R 篩選器中創建的所有篩選條件,只需點擊介面底部的橡皮擦圖標,然後點擊「應用」即可。

以下是幾個範例(前提是您的數據中包含這些欄位):

基於性別和測試分數的篩選

  • 篩選條件:性別為女性且測試分數大於 5: Gender == "Female" & TestScore > 5
  • 在考慮之前透過拖放篩選器或變量視窗創建的篩選條件的基礎上,進行性別和測試分數篩選: generatedFilter & Gender == "Female" & TestScore > 5

按性別分組篩選年齡

  • 篩選條件:年齡小於其性別組別中的平均年齡: (mean(Age) > Age) %|% Sex
  • %|% 運算符 是 JASP 特有的 R 運算符,它確保左側的程式碼會對右側變量的每個組別單獨執行。在上述範例中,篩選條件會針對每個性別分別計算平均年齡,並篩選出低於該性別平均年齡的數據。
  • 注意:確保將條件表達式用括號括起來。例如,以下程式碼將無法按預期運行: mean(Age) > Age %|% Sex 因為這樣只會將年齡按性別進行分組,而平均年齡的計算仍基於整列數據。

R 篩選器的靈活性

雖然拖放篩選器的運算符和功能存在一定限制,但使用 R 模式篩選器的可能性幾乎是無限的。任何以 R 語法表示的篩選條件都可以在 JASP 的 R 篩選器中運行。

avatar-img
224會員
127內容數
文章內容以圖像式和步驟化方式,教您如何在各種統計軟體中(例如:SPSS、R和Mplus),執行多種統計方法。此外,我還會分享一些學術和科技新知,幫助您在學術之路上走得更順利。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
心理博士的筆記本 的其他內容
JASP 是一款免費的統計軟體,以其直觀的界面和強大的功能,成為社會科學和人文學科領域研究者的首選,本文將介紹如何使用此軟體。
JASP 是一款免費的統計軟體,以其直觀的界面和強大的功能,成為社會科學和人文學科領域研究者的首選,本文將介紹如何使用此軟體。
本篇參與的主題活動
avatar-avatar
跳鼠飛行日記
發佈於格友大廳
新春新氣象,紅紅春聯貼門上,迎來整年的喜漾。 忘了從什麼時候開始,門上的春聯不再是塑料印紙不再只是張春聯,每天回家都會多看一眼多欣賞一下自己的才華?從貼上春聯前的一刻就在期待今年的模樣。
Danielson在丹麥哥本哈根提前與朋友們過農曆年夜飯,並分享五道菜餚的烹飪過程及食譜心得,包括三杯雞、蒜辣香菜牛肉片、蒜味豆乾炒毛豆仁、農家小炒肉及蒜炒青江菜。文章也提及甜點及與朋友們歡聚的溫馨時光,最後並祝讀者新年快樂。
每年一月就是最冷的時候,今年寒流一波波來,想到過往在歐洲,大地被撒滿白雪的模樣,甚是懷念,今年來到北台灣最大梅花園,就位於桃園復興鄉的角板山行館,樹上一朵朵小小的梅花盛開,宛如被初雪撒上了枝頭,在藍天白雲下,頗有踏雪尋梅的感覺呢!
avatar-avatar
跳鼠飛行日記
發佈於格友大廳
新春新氣象,紅紅春聯貼門上,迎來整年的喜漾。 忘了從什麼時候開始,門上的春聯不再是塑料印紙不再只是張春聯,每天回家都會多看一眼多欣賞一下自己的才華?從貼上春聯前的一刻就在期待今年的模樣。
Danielson在丹麥哥本哈根提前與朋友們過農曆年夜飯,並分享五道菜餚的烹飪過程及食譜心得,包括三杯雞、蒜辣香菜牛肉片、蒜味豆乾炒毛豆仁、農家小炒肉及蒜炒青江菜。文章也提及甜點及與朋友們歡聚的溫馨時光,最後並祝讀者新年快樂。
每年一月就是最冷的時候,今年寒流一波波來,想到過往在歐洲,大地被撒滿白雪的模樣,甚是懷念,今年來到北台灣最大梅花園,就位於桃園復興鄉的角板山行館,樹上一朵朵小小的梅花盛開,宛如被初雪撒上了枝頭,在藍天白雲下,頗有踏雪尋梅的感覺呢!
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
商業簡報不僅僅是呈現數據,更需要深入瞭解數據分析及有效的工具運用。本文探討於Excel中使用不同函數來改善數據處理效率,包括IF、IFS、VLOOKUP、XLOOKUP及INDEX與MATCH的結合,幫助商業人士更好地從數據中提取洞見,助力業務增值,學習優化數據分析過程,讓您的商業簡報更具影響力。
Thumbnail
數據分析是現代社會的核心技能,適用於各行各業。無論是在市場營銷、財務管理,還是產品開發中,數據分析都扮演著至關重要的角色。提升數據敏感度有助於提高分析的準確性和效率,使我們能夠迅速找到關鍵信息,進而做出明智的決策。本文將探討數據分析訓練方法,提供實用案例,幫助初學者快速掌握數據分析技術。
Thumbnail
有時候在其他檔案轉換成SPSS檔時,可能出現在一個變項內,以特定符號將不同數字分開的(如下圖,第三行4,7,8),這時無法用SPSS進行有效分析。本文將說明如何使用SPSS將特定符號分開的數字轉換成不同變項,光看文字可能太過抽象,請看圖文教學。
如何在SQL實踐中EXCEL 常用功能 篩選 和 擷取文字串?需要熟練地使用分組(GROUP BY) 與 排序 (ORDER BY) 以及SUBSTRING_INDEX函數!
Thumbnail
這邊統整了所有過去發表過關於 QUERY 函式的教學分享,希望可以方便你按照順序閱讀和練習。 QUERY 可以用來查詢、篩選、聚集、排序資料,還可以做張簡易的資料透視表,是我在 Google 試算表上做數據分析、製作報告、製作儀表板時最常用的函式之一,既方便又好用,誠心推薦!
Thumbnail
你是否曾經遇到這樣的情況?手上有一張表格,需要根據某個欄位進行分類,但表格又很繁雜,如果手動一個個查找,就需要花費大量時間才能找到想要的資料,這樣實在是太沒效率又容易眼花。 今天,我就來教你一個FILTER 函數快速分類技巧,讓你輕鬆掌握數據,節省時間。
Thumbnail
Excel是職場上最常使用的軟體之一,學會Excel的常用技巧可以讓工作效率大幅提升。今天要教大家一個Excel的小技巧,可以一秒自動統計數據,並結合下拉式選單,讓工作更輕鬆。 其他應用:這個技巧還可以應用於其他領域,例如:統計考試成績、統計銷售額、統計客戶數量
Thumbnail
Excel 是辦公室必備的軟體,在處理數據時,常遇到需要快速篩選數據的需求。例如,我們需要將銷售額大於 100 萬的商品列出,以便製作報表。如果手動篩選,不僅費時費力,而且容易出錯。Excel提供了兩個功能幫助快速篩選數據:自動篩選:根據欄位中的值來篩選數據。下拉式選單:讓使用者根據需求來篩選數據。
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
商業簡報不僅僅是呈現數據,更需要深入瞭解數據分析及有效的工具運用。本文探討於Excel中使用不同函數來改善數據處理效率,包括IF、IFS、VLOOKUP、XLOOKUP及INDEX與MATCH的結合,幫助商業人士更好地從數據中提取洞見,助力業務增值,學習優化數據分析過程,讓您的商業簡報更具影響力。
Thumbnail
數據分析是現代社會的核心技能,適用於各行各業。無論是在市場營銷、財務管理,還是產品開發中,數據分析都扮演著至關重要的角色。提升數據敏感度有助於提高分析的準確性和效率,使我們能夠迅速找到關鍵信息,進而做出明智的決策。本文將探討數據分析訓練方法,提供實用案例,幫助初學者快速掌握數據分析技術。
Thumbnail
有時候在其他檔案轉換成SPSS檔時,可能出現在一個變項內,以特定符號將不同數字分開的(如下圖,第三行4,7,8),這時無法用SPSS進行有效分析。本文將說明如何使用SPSS將特定符號分開的數字轉換成不同變項,光看文字可能太過抽象,請看圖文教學。
如何在SQL實踐中EXCEL 常用功能 篩選 和 擷取文字串?需要熟練地使用分組(GROUP BY) 與 排序 (ORDER BY) 以及SUBSTRING_INDEX函數!
Thumbnail
這邊統整了所有過去發表過關於 QUERY 函式的教學分享,希望可以方便你按照順序閱讀和練習。 QUERY 可以用來查詢、篩選、聚集、排序資料,還可以做張簡易的資料透視表,是我在 Google 試算表上做數據分析、製作報告、製作儀表板時最常用的函式之一,既方便又好用,誠心推薦!
Thumbnail
你是否曾經遇到這樣的情況?手上有一張表格,需要根據某個欄位進行分類,但表格又很繁雜,如果手動一個個查找,就需要花費大量時間才能找到想要的資料,這樣實在是太沒效率又容易眼花。 今天,我就來教你一個FILTER 函數快速分類技巧,讓你輕鬆掌握數據,節省時間。
Thumbnail
Excel是職場上最常使用的軟體之一,學會Excel的常用技巧可以讓工作效率大幅提升。今天要教大家一個Excel的小技巧,可以一秒自動統計數據,並結合下拉式選單,讓工作更輕鬆。 其他應用:這個技巧還可以應用於其他領域,例如:統計考試成績、統計銷售額、統計客戶數量
Thumbnail
Excel 是辦公室必備的軟體,在處理數據時,常遇到需要快速篩選數據的需求。例如,我們需要將銷售額大於 100 萬的商品列出,以便製作報表。如果手動篩選,不僅費時費力,而且容易出錯。Excel提供了兩個功能幫助快速篩選數據:自動篩選:根據欄位中的值來篩選數據。下拉式選單:讓使用者根據需求來篩選數據。