如何在 JASP 中篩選數據

更新 發佈閱讀 8 分鐘

本篇文章將透過幾個範例,展示如何使用這項新的篩選功能。

JASP 的篩選功能提供了三種介面:點擊篩選器(Click Filter)、拖放篩選器(Drag and Drop Filter)以及 R 篩選器(R Filter)。本文翻譯自JASP部落格文章


點擊篩選器 (Click Filter)

點擊篩選器是一個簡單的篩選介面,用於篩選分類變量。可以通過點擊需要篩選的變量欄位標題來使用。

在第一個範例中,我們將使用數據集「Kitchen Rolls」(Data Library -> Kitchen Rolls),示範如何根據一個或多個分類變量的約束條件進行篩選。假設我們只想分析女性學生的數據。「Kitchen Rolls」包含兩個與此相關的變量:

  • Sex(性別):記錄每位參與者的性別('M' 表示男性,'F' 表示女性)。
  • Student(是否為學生):記錄每位參與者是否為學生('Y' 表示是,'N' 表示否)。

操作步驟如下:

  1. 點擊 Sex 欄位標題,取消勾選 "M",以排除男性參與者的數據。
  2. 然後點擊 Student 欄位標題,取消勾選 "N",以排除非學生的數據。

完成後,數據中只會保留性別為 "F" 且為學生 ("Y") 的行。如果需要清除通過點擊篩選器創建的所有篩選條件,只需點擊右側的橡皮擦圖標即可。


https://jasp-stats.org/2018/06/27/how-to-filter-your-data-in-jasp/

https://jasp-stats.org/2018/06/27/how-to-filter-your-data-in-jasp/


拖放篩選器 (Drag & Drop Filter)

拖放篩選器讓您可以通過簡單的拖放操作來創建篩選條件。在 JASP 中加載數據集或 .jasp 文件後,可以通過點擊數據視圖左上角的篩選圖標來訪問拖放篩選器。


篩選一個或多個分類變量

現在,我們使用拖放篩選器創建與前例相同的篩選條件。在從資料庫加載數據文件後,我們可以如上所述訪問拖放篩選器。接下來,將左側菜單中的 Sex(性別)變量拖入篩選框,並選擇 =。注意,您也可以通過點擊直接添加變量或運算符。然後,點擊公式右側的空白區域,輸入 ‘F’,並按下 Enter。之後,點擊「應用透過篩選器」按鈕 (Apply pass-through filter),這樣篩選後,Sex 欄中只有包含 ‘F’ 的行會保持活躍狀態。

為了篩選出所有女性學生,我們需要在下方添加另一個公式:將 Student(是否為學生)變量拖入篩選框,並選擇 =。接著輸入 ‘Y’,按下 Enter。應用篩選後,我們會看到只剩下滿足 Sex = F 並且 Student = Y 的受試者。

同樣地,例如,如果我們想激活某變量不等於特定值的受試者,可以在篩選中插入 。若需刪除所有通過拖放篩選器創建的篩選條件,只需雙擊垃圾桶圖標並應用即可。

https://jasp-stats.org/wp-content/uploads/2018/06/02_drag_cat.gif

https://jasp-stats.org/wp-content/uploads/2018/06/02_drag_cat.gif


篩選連續變量

接下來,我們將探討如何根據連續變量的等式或不等式約束篩選數據,也就是對「比例」類型的變量使用例如等於、大於或小於等操作。舉例來說,我們將使用數據集「Presents' Height」(資料庫 -> Miscellaneous),該數據集包含每位美國總統的身高比例(即他們的身高與最接近競爭者的身高相比)以及其普選支持率。

假設我們想從連續變量 Heights Ratio(身高比例)中篩選掉所有異常值。實現此操作的一種方法是:

  1. 進入「描述性統計」(Descriptives),點擊「描述性統計」選項(Descriptive Statistics)。
  2. 在「圖表」(Plots)中請求生成箱線圖(Boxplot)。
  3. 勾選箱線圖選項中的「標記異常值」(Label Outliers)。

完成上述操作後,我們可以看到數據中有一個異常值,該值位於第 10 行。此時,您的 JASP 窗口應顯示如下內容:

raw-image

確定異常值的位置後,我們可以進一步篩選掉該異常值。首先,點擊 OK 以退出描述性統計的選單。向下滾動到第 10 行,我們可以看到這位總統的身高比例為 1.18405。同時,我們注意到變量 V1 代表行號,這非常方便,因為我們可以直接基於該變量進行篩選,而無需記住這位總統的具體身高比例。

進入拖放篩選器後,將變量 V1 拖入篩選框中。我們希望篩選器保留該變量中除第 10 行以外的所有值,因此將運算符 ≠ 拖到 V1 的旁邊。然後點擊 ≠ 右側的空白區域,輸入 ‘10’,並按下 Enter。最後,點擊「應用透過篩選器」(Apply pass-through filter),我們會看到第 10 行的數據已被篩選掉。當然,我們也可以直接基於變量 Heights Ratio 進行篩選,使用篩選公式 Heights Ratio ≠ 1.18405。另一種方式是建立「小於/大於」的篩選公式。該異常值的身高比例為 1.18405,但箱線圖顯示其他數據中沒有超過 1.15 的異常值。因此,篩選公式 Heights Ratio < 1.15 也可以達到篩選效果,保留所有身高比例低於 1.15 的數據。

raw-image


R 篩選器 (R Filter)

可以通過點擊拖放篩選器左下角的「R」圖標訪問 R 篩選器。使用 R 篩選器,您可以為數據撰寫自定義篩選條件,這些條件是拖放篩選器無法提供的。此外,您還可以將 R 模式下創建的篩選條件與在變量視窗中選擇的篩選器或拖放篩選器中創建的條件結合使用。

實際上,您可以輕鬆查看由其他篩選器生成的程式碼,這些程式碼顯示在頂部只讀的文本框中,以 generatedFilter <-開頭。例如,保持先前拖放篩選器範例中創建的篩選條件啟用,然後切換到 R 模式,系統會顯示以下介面(頂部顯示生成的篩選條件的 R 語法):

raw-image
raw-image

在程式碼視窗中,您只需輸入目標欄位的名稱即可引用您的數據。JASP 會自動確保其引用正確的數據。如果欄位名稱包含空格,則必須將這些空格一併輸入。若需清除在 R 篩選器中創建的所有篩選條件,只需點擊介面底部的橡皮擦圖標,然後點擊「應用」即可。

以下是幾個範例(前提是您的數據中包含這些欄位):

基於性別和測試分數的篩選

  • 篩選條件:性別為女性且測試分數大於 5: Gender == "Female" & TestScore > 5
  • 在考慮之前透過拖放篩選器或變量視窗創建的篩選條件的基礎上,進行性別和測試分數篩選: generatedFilter & Gender == "Female" & TestScore > 5

按性別分組篩選年齡

  • 篩選條件:年齡小於其性別組別中的平均年齡: (mean(Age) > Age) %|% Sex
  • %|% 運算符 是 JASP 特有的 R 運算符,它確保左側的程式碼會對右側變量的每個組別單獨執行。在上述範例中,篩選條件會針對每個性別分別計算平均年齡,並篩選出低於該性別平均年齡的數據。
  • 注意:確保將條件表達式用括號括起來。例如,以下程式碼將無法按預期運行: mean(Age) > Age %|% Sex 因為這樣只會將年齡按性別進行分組,而平均年齡的計算仍基於整列數據。

R 篩選器的靈活性

雖然拖放篩選器的運算符和功能存在一定限制,但使用 R 模式篩選器的可能性幾乎是無限的。任何以 R 語法表示的篩選條件都可以在 JASP 的 R 篩選器中運行。

留言
avatar-img
教育心理博士的筆記本
265會員
141內容數
文章內容以圖像式和步驟化方式,教您如何在各種統計軟體中(例如:SPSS、R和Mplus),執行多種統計方法。
2025/01/23
JASP的教學影片清單,涵蓋描述統計、t 檢定、一般線性模型,以及卡方檢定等主題。每支影片均由 Todd Daniel 博士製作,並免費在Research By Design頻道公開給大家看,適合初學者與需要快速掌握特定分析方法的使用者。
2025/01/23
JASP的教學影片清單,涵蓋描述統計、t 檢定、一般線性模型,以及卡方檢定等主題。每支影片均由 Todd Daniel 博士製作,並免費在Research By Design頻道公開給大家看,適合初學者與需要快速掌握特定分析方法的使用者。
2025/01/23
雨雲圖(Raincloud Plots)是一種結合數據點雲、箱型圖與小提琴圖的視覺化方法,由 Micah Allen 等人提出。JASP 最新版本將此功能納入 T 檢定和 ANOVA 模組,讓用戶能直觀地展示和比較數據分布與差異。本文將簡介此作法。 如何在
Thumbnail
2025/01/23
雨雲圖(Raincloud Plots)是一種結合數據點雲、箱型圖與小提琴圖的視覺化方法,由 Micah Allen 等人提出。JASP 最新版本將此功能納入 T 檢定和 ANOVA 模組,讓用戶能直觀地展示和比較數據分布與差異。本文將簡介此作法。 如何在
Thumbnail
2025/01/11
JASP 是一款免費的統計軟體,以其直觀的界面和強大的功能,成為社會科學和人文學科領域研究者的首選,本文將介紹如何使用此軟體。
Thumbnail
2025/01/11
JASP 是一款免費的統計軟體,以其直觀的界面和強大的功能,成為社會科學和人文學科領域研究者的首選,本文將介紹如何使用此軟體。
Thumbnail
看更多
你可能也想看
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
SUMIF 函數是數據分析的利器,幫助你輕鬆篩選並加總特定條件下的數據。無論你想了解某產品在特定期間內的銷售總額,或是分析特定客戶的購買金額,SUMIF 都能快速提供精確結果。這個工具適合自動化報表設定和即時數據分析,讓你不必手動篩選數據即可得到所需的答案。
Thumbnail
SUMIF 函數是數據分析的利器,幫助你輕鬆篩選並加總特定條件下的數據。無論你想了解某產品在特定期間內的銷售總額,或是分析特定客戶的購買金額,SUMIF 都能快速提供精確結果。這個工具適合自動化報表設定和即時數據分析,讓你不必手動篩選數據即可得到所需的答案。
Thumbnail
在使用R跑多層次模型時,有時候會遇到連續調節變項,這時候分析會和類別調節變項有所差異,本文在介紹遇到連續調節變項時,如何進行簡單斜率分析,以及如何畫交互作用圖,最後再說如何使用Johnson-Neyman法。
Thumbnail
在使用R跑多層次模型時,有時候會遇到連續調節變項,這時候分析會和類別調節變項有所差異,本文在介紹遇到連續調節變項時,如何進行簡單斜率分析,以及如何畫交互作用圖,最後再說如何使用Johnson-Neyman法。
Thumbnail
本文討論如何利用數據來判斷金融盤勢。重點關注非農就業指數(NFP)、採購經理人指數(PMI)、失業率、消費者物價指數(CPI)等相關重要數據,並提供相關數據公佈時間,以及例子操作模式。文章還著重於數據對交易者決策和交易策略的影響。
Thumbnail
本文討論如何利用數據來判斷金融盤勢。重點關注非農就業指數(NFP)、採購經理人指數(PMI)、失業率、消費者物價指數(CPI)等相關重要數據,並提供相關數據公佈時間,以及例子操作模式。文章還著重於數據對交易者決策和交易策略的影響。
Thumbnail
直接用例子舉例,下圖的數據用眼睛看很難看出相關比較與趨勢,但是如果畫成圖表呢?密密麻麻好幾條線,要看出趨勢對於眼睛來說是個很大的考驗,那麼改怎麼做才能將這樣的數據可視化呢? 今天將會提供三種方法 可以先下載檔案一邊看教學一邊練習,這樣才不會忘記唷 檔案下載 第一種:設定格式化條件 設定格式化條件裡面
Thumbnail
直接用例子舉例,下圖的數據用眼睛看很難看出相關比較與趨勢,但是如果畫成圖表呢?密密麻麻好幾條線,要看出趨勢對於眼睛來說是個很大的考驗,那麼改怎麼做才能將這樣的數據可視化呢? 今天將會提供三種方法 可以先下載檔案一邊看教學一邊練習,這樣才不會忘記唷 檔案下載 第一種:設定格式化條件 設定格式化條件裡面
Thumbnail
在商業簡報中,資訊圖表有助於展示數據的趨勢。當要呈現多項數據的前後比較時,分項式的長條圖就很常見。如果我們想更視覺化地展示數據變化的幅度,讓觀眾一看便知道哪項差距最大,可改用啞鈴圖。你可能會說,Office預設圖表類型沒有啞鈴圖,需要用上其他軟體或編程吧?其實,單單運用Excel就可以造出啞鈴圖呢。
Thumbnail
在商業簡報中,資訊圖表有助於展示數據的趨勢。當要呈現多項數據的前後比較時,分項式的長條圖就很常見。如果我們想更視覺化地展示數據變化的幅度,讓觀眾一看便知道哪項差距最大,可改用啞鈴圖。你可能會說,Office預設圖表類型沒有啞鈴圖,需要用上其他軟體或編程吧?其實,單單運用Excel就可以造出啞鈴圖呢。
Thumbnail
技術分析的概念分享總整理 可能很多新進朋友沒有参與到之前的文章,老爹之前有針對技術分析寫了一些使用方法跟簡單的概念,這裡做一下總整理。 “警語:此處的所有文章跟說明及例子皆是做概念探討跟分析使用,不做股票投資或投機之買賣建議。任何買賣,使用何者指標,皆應由買賣者自行負責。” 【均線】 https:/
Thumbnail
技術分析的概念分享總整理 可能很多新進朋友沒有参與到之前的文章,老爹之前有針對技術分析寫了一些使用方法跟簡單的概念,這裡做一下總整理。 “警語:此處的所有文章跟說明及例子皆是做概念探討跟分析使用,不做股票投資或投機之買賣建議。任何買賣,使用何者指標,皆應由買賣者自行負責。” 【均線】 https:/
Thumbnail
驗證性因素分析(Confirmatory Factor Analysis, CFA)常被作為檢驗量表或測量工具之建構效度。做SEM前大多會要求每個工具的CFA結果。不僅如此,CFA也可能拿來檢驗測量衡等性的有效工具。本文將簡介驗證性因素分析概念,並介紹如何用Mplus 操作。
Thumbnail
驗證性因素分析(Confirmatory Factor Analysis, CFA)常被作為檢驗量表或測量工具之建構效度。做SEM前大多會要求每個工具的CFA結果。不僅如此,CFA也可能拿來檢驗測量衡等性的有效工具。本文將簡介驗證性因素分析概念,並介紹如何用Mplus 操作。
Thumbnail
創作者福音!本篇文章分享「數據統計儀表板」體驗心得,覺得最實用的功能有哪些?輔以一些小 Tips⋯⋯從數據挖掘出更多面向,了解市場的想法;按圖索驥,辨識出哪些文章表現精彩,哪些文章尚有不足? 這些後台數據,是一種「外部觀點」,除了表象的愛心數外,能夠挖掘出更多面向(指標),了解市場的想法;按圖
Thumbnail
創作者福音!本篇文章分享「數據統計儀表板」體驗心得,覺得最實用的功能有哪些?輔以一些小 Tips⋯⋯從數據挖掘出更多面向,了解市場的想法;按圖索驥,辨識出哪些文章表現精彩,哪些文章尚有不足? 這些後台數據,是一種「外部觀點」,除了表象的愛心數外,能夠挖掘出更多面向(指標),了解市場的想法;按圖
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News