BMJ統計小小問題(1):評估兩個連續性變項線性相關程度

閱讀時間約 6 分鐘
匯東華的周末統計小小問題 :D
預定每周末出刊
British Medical Journal,英國醫學期刊(British Medical Journal,簡稱 BMJ),是一份同行評審性質的綜合醫學期刊,創始於1840年,是最古老的醫學期刊之一。2020年的IF=39.890,在醫學研究領域享有盛名。
BMJ自2008年9月開始至2015年由兩位流行病與統計學專家持續出了300多期Statistical question系列。在這個系列中,兩位學者每次出一道統計與流行病學有關的選擇題作答及解釋。本系列將精選Statistical Question,採用中英對照,有興趣的朋友們可進行回答。
BMJ 統計問題(1):評估兩個連續變項線性相關程度最適合的分析方式為何?(單選)
A. 散佈圖 (Scatter plot)
B. OR值 (Odds ratio)
C. 長條圖 (Bar chart)
D. 相關係數 (Correlation)
How would you best assess the degree of linear association between two continuous variables?
a) Scatter plot
b) Odds ratio
c) Bar chart
d) Correlation
Answer:
A scatter plot would display graphically the association between two continuous variables. The x axis displays values for one variable, and the y axis values for the other. Each point represents one paired measurement of each variable. This is a useful way to display the data and would show U shaped and other non-linear associations as well as linear associations.
However, a scatter plot does not measure an association. To put a number to it requires an assessment of correlation. Pearson’s correlation coefficient or Spearman’s rank correlation coefficient may be used to assess linear correlation. The correlation coefficient may take any value between 1 and −1: 0 represents no linear association, 1 represents a perfect straight line with y values increasing with increasing x values, −1 represents a perfect straight line with y values decreasing with increasing x values. Like other parametric techniques, Pearson’s correlation coefficient is sensitive to outlying values and may generate misleading P values when the y axis values are not normally distributed. Spearman’s rank correlation coefficient, like other non-parametric techniques, is less sensitive and more robust.
Odds ratios can be used to compare only dichotomous values. Odds express the probability of something happening divided by the probability of it not happening.
A bar chart is used to plot the frequency of a nominal variable (such as eye colour) or an ordinal variable (such as agreement with a survey question: “disagree strongly, disagree, agree, agree strongly.
中文說明:
散佈圖:以圖形方式顯示兩個連續變數之間的關聯。x軸顯示一個變數的值,y軸顯示另一個變數的值。每個點代表每個變數的一對測量值。這是一種顯示資料的有效方法,可以看出U形和其他非線性關聯以及線性關聯。但是,散佈圖無法準確衡量相關強度。要衡量關聯性,一般需要顯示相關程度之量化指標(相關係數)。
相關係數:衡量兩個變項線性相關的程度。皮爾森相關係數或斯皮爾曼等級相關係數可用於評估線性相關。相關係數介於1到-1之間的任何值:0表示兩變項沒有線性相關,1表示y值隨x值增加而增加的理想直線,-1表示y值隨x值增加而減少的理想直線。與其他母數分析法一樣,Pearson的相關係數對異常值敏感,容易受到影響,且當y值不呈常態分佈時,可能會產生誤導的P值。與其他無母數統計分析法一樣,Spearman的等級相關係數敏感度較低,較為穩健(robust)。
勝算比(Odds ratios,OR):僅可用於比較二分類數值,勝算(Odds)表示事件發生的機率除以未發生的機率。
長條圖:以圖示呈現名義變數(如:眼睛的顏色)或序位變數(如:調查問題的同意程度:“非常不同意,不同意,同意,非常同意”的次數)。
所以答案為 D (Correlation)
改編自:BMJ Statistical Question與「醫學論文與統計分析」鄭衛軍老師官網
為什麼會看到廣告
11會員
34內容數
她叫"匯東華統計顧問有限公司"。匯東華意味著匯聚東方璀璨之月華。月長在,東方長在,匯東華長在;月有情,東方有情,匯東華有情。我創造她抑或是最後會是她造就了我,不可而得,我很期待。 這是我跟她、她跟我的成長過程,她有機會活得比我久,承襲我的信念留下來,那將會是件很美好的事。
留言0
查看全部
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
入選本屆台灣國際兒童影展國際競賽單元的《小小撒哈拉》,奪下了「最佳紀錄片」的獎項完全是實至名歸。《小小撒哈拉》以孩童視角入題卻早已跨越了年齡的界線,孩子的想像力為本片添上了翅膀,飛向全世界傳遞重要的求救訊號,位於非洲西北的西撒哈拉,這群撒拉威人不願再流亡,渴望回到家園的心意。孩子們將歷史凝縮至沙中,
Thumbnail
西方有句諺語是這樣描述的,謊言有三種:謊言、該死的謊言和統計數據,那在投資圈裡利用統計數據來說謊的現象是不是也存在呢? 一、精挑細選的平均值? 不知道你是否看過這樣的新聞,類似"2023台股大豐收!平均每位股民賺近OO萬元"的新聞標題,在這樣文章中,新聞記者通常會用這樣的方法來計算: 根據
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
一文掌握Fed重點決策:修改聲明措辭、3月不太可能降息、未準備好宣布軟著陸 鮑爾於會後表示,Fed 可能已經完成本輪緊縮周期所需的所有升息,若經濟大致上如預期發展,在今年某個時候開始放寬政策可能是適當的。但他也說:「我們還沒有真正處於那個階段,還沒有降息的計畫。沒有積極考慮調降聯邦基金利率。」
Thumbnail
檢查樣本數據是否符合常態分配,價格數據若是符合常態分配,則視為正常行情,反之則視為有突破訊號。常態分配檢定有數種方法,本文介紹的是w/s檢定,檢定統計量僅需計算樣本全距(w),還有標準差(s),然後求其比值,接者透過查表比較其上、下臨界值,查表值請參考下圖
Thumbnail
借用優勢比這個概念,觀察價格數據資料的多空變化,資料數據請參考下表一
Thumbnail
Kolmogorov-Smirnov 適合度檢定,該方法為檢定樣本次數分配與某一特定母群體分配間的差異是否達到顯著性(一般用來檢定常態分配或是其他類型的連續性分配)。檢定統計量邏輯、計算流程、查表值請參考下列敘述
Thumbnail
Durbin-Watson test,對模組的殘差項進行相關聯性檢定,常應用於迴歸分析以及需要限制殘差項要為獨立常態分配。不過我在應用上更關心價格資料是否有聚集在均線附近,若有則可以判定盤整盤,反之則有趨勢發生,相關統計檢定計算步驟詳列如下
Thumbnail
承續前篇,透過觀察統計檢定量的公式,隨機性的檢定是透過前、後期的資料乘積與均數差異的平方,取其比值大小最為判斷,現在透過更為高階的動差概念,來討論價格資料是否屬於盤整型態,其中以動差的視角來看,均數屬於一階動差、變異數屬於二階動差、偏態屬於三階動差、峰態屬於四階動差,相關公式詳列如下
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
入選本屆台灣國際兒童影展國際競賽單元的《小小撒哈拉》,奪下了「最佳紀錄片」的獎項完全是實至名歸。《小小撒哈拉》以孩童視角入題卻早已跨越了年齡的界線,孩子的想像力為本片添上了翅膀,飛向全世界傳遞重要的求救訊號,位於非洲西北的西撒哈拉,這群撒拉威人不願再流亡,渴望回到家園的心意。孩子們將歷史凝縮至沙中,
Thumbnail
西方有句諺語是這樣描述的,謊言有三種:謊言、該死的謊言和統計數據,那在投資圈裡利用統計數據來說謊的現象是不是也存在呢? 一、精挑細選的平均值? 不知道你是否看過這樣的新聞,類似"2023台股大豐收!平均每位股民賺近OO萬元"的新聞標題,在這樣文章中,新聞記者通常會用這樣的方法來計算: 根據
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
一文掌握Fed重點決策:修改聲明措辭、3月不太可能降息、未準備好宣布軟著陸 鮑爾於會後表示,Fed 可能已經完成本輪緊縮周期所需的所有升息,若經濟大致上如預期發展,在今年某個時候開始放寬政策可能是適當的。但他也說:「我們還沒有真正處於那個階段,還沒有降息的計畫。沒有積極考慮調降聯邦基金利率。」
Thumbnail
檢查樣本數據是否符合常態分配,價格數據若是符合常態分配,則視為正常行情,反之則視為有突破訊號。常態分配檢定有數種方法,本文介紹的是w/s檢定,檢定統計量僅需計算樣本全距(w),還有標準差(s),然後求其比值,接者透過查表比較其上、下臨界值,查表值請參考下圖
Thumbnail
借用優勢比這個概念,觀察價格數據資料的多空變化,資料數據請參考下表一
Thumbnail
Kolmogorov-Smirnov 適合度檢定,該方法為檢定樣本次數分配與某一特定母群體分配間的差異是否達到顯著性(一般用來檢定常態分配或是其他類型的連續性分配)。檢定統計量邏輯、計算流程、查表值請參考下列敘述
Thumbnail
Durbin-Watson test,對模組的殘差項進行相關聯性檢定,常應用於迴歸分析以及需要限制殘差項要為獨立常態分配。不過我在應用上更關心價格資料是否有聚集在均線附近,若有則可以判定盤整盤,反之則有趨勢發生,相關統計檢定計算步驟詳列如下
Thumbnail
承續前篇,透過觀察統計檢定量的公式,隨機性的檢定是透過前、後期的資料乘積與均數差異的平方,取其比值大小最為判斷,現在透過更為高階的動差概念,來討論價格資料是否屬於盤整型態,其中以動差的視角來看,均數屬於一階動差、變異數屬於二階動差、偏態屬於三階動差、峰態屬於四階動差,相關公式詳列如下