統計急救箱─變數與變數類型

更新於 發佈於 閱讀時間約 6 分鐘

什麼是變數?

  變數的英文是variables,也會有人翻譯成變量或者變項,當形容詞使用的時候意思是「多變的」。在統計學或者數學上,當我們說某個東西是一個變數時,表示這東西的值 (value) 會改變。與變數相對的詞,就叫做常數 (constant),表示這個東西的值不管到哪裡、不管什麼時候都是一樣的。
  生活中到處都可以看到變數的例子,像是溫度每天都會有變化,那溫度就是一個變數。或者每個人的身高體重都不一樣,那身高體重在人群當中也是一個變數。相反的,常數的例子反而在生活中比較少碰到,畢竟生活中大多數東西都不是固定不變的。最有名的常數大概是圓周率pi了,它的數值永遠就是3.14159...。
  變數是統計學的根本,正是因為這些數值會隨著不同的狀況而改變,才會需要統計。我們沒有必要去統計常數的,假如有天有人跟你說:「我們來算一下圓周率的平均數。」,那他可能是想講一個笑話,或者喝醉了。

社會科學中的變數

  量化社會科學研究當中,研究者會使用變項式的方式對現象進行思考(顏志龍,2021)。也就是在這個現象當中,有哪些變項存在?它們是否影響其他變項?它們是否受到其他變項影響?換句話說就是拆解出各種變項,然後探討這些變項之間的關係。當然一個現象當中的變項一定是超級多,所以研究者就會開始取捨自己要關注的部分在哪裡,接著設計相應的研究方法。
  例如「打電動是否會增加一個人的暴力程度?」這種問題,裡面就很粗略地描述了兩個變項:1. 打電動,2. 暴力程度。但再延伸一點就會發現還有更多隱藏的變項存在,例如性別、常玩的遊戲類型、玩遊戲的時數、玩遊戲的動機等等。在設計研究的時候,就會同時考慮到這些隱藏的變項該擔任什麼角色,或者先捨棄不管它。

變數的類型

  有非常多統計教科書裡面都一定會提到變數的類型,很顯然的這件事情很重要。最主要的原因是:變數的類型不同,適合使用的統計方法也不一樣。
  變數的類型也有諸多不同的區分方式,這裡只介紹最常看到的三種。

名義變數 (nominal variable)

  白話點說,名義變數就是分類,然後每個類型都會給它一個數字當名字。例如依照性別分類,屬於男生的人編碼為1,屬於女生編碼為2,其他為3。或者幫水果分類,蘋果是1、橘子是2、西瓜是3...等等。
  在名義變數中,「數字」只是取代各種類別的「名稱」而已。在軍隊裏面的編號,也是一樣的道理。

次序變數 (ordinal variable)

  次序變數也是一種表示類別的變數,但它跟上面的名義變數有個決定性的差別──次序變數不只分類,還有排序。數值的遞增往往代表某個屬性 (attribute) 也跟著遞增或者遞減。
  最典型的次序變數就是名次了。考得最好的人是第一名,然後是第二名、第三名...。隨著名次的數值越大,考試的分數也跟著下降。所以我們可以光從名次就推斷,考第5名的人分數比考第2名的人還低;考第8名的也比第5名還低。
  這個特性在上面的名義變數裡面不會存在,我們不會說座號2號的人一定在某方面比1號差,因為座號純粹只是一種取代名字的變數而已。但如果當初分發座號的時候,是依照某種屬性排序後給予的,那就是次序變數了。例如入學考試最高分的人是1號,第二高的是2號;或者身高最高的是1號、第二高的是2號。
  總之,如果我們可以根據變數數值來推論某個屬性的高低,那這個變數就具有次序性。這是次序變數和名義變數的關鍵差異。

等距變數 (interval variable)

  等距變數也具有次序性,跟次序變數的關鍵差別在於等距尺度是等間隔的。
  以身高排序來說,我們知道1號是最高的人、2號是次高的人,但我們不會知道1號和2號的身高差是不是等於3號和4號的身高差。這是因為次序變數沒有等間隔的特性,1號和2號的差距,未必等於2號和3號的差距。如果去觀察賽跑前三名的時間差,就會很明確地看出這個狀況了。
  而等距變數除了具有次序性的特性之外,還是等間隔的。同樣以身高來說,「公分」就具有等間隔的特性 [*1],183公分比182公分多1公分,182公分也比181公分多1公分,而這個1公分是同樣的長度。賽跑也是一樣,第一名跑9秒、第二名跑10秒、第三名跑12秒,都是以1秒為單位來計算的,而這1秒的長度並不會因為名次而有所不同。 所以「秒數」也具有等間隔的特性 [*1]。
  前面稍微提到過,不同的變數適用於不同的統計方法。雖然這在推論統計裡面尤其重要,但在這邊可以舉一個很簡單的例子。例如在名義變數和次序變數當中,基本上就不適用「平均數」的概念。
  可以想想如果名義變數做平均會發生什麼事呢?假如1代表蘋果,2代表橘子,那1跟2平均起來是1.5,可是蘋果和橘子平均起來...蘋果跟橘子好像不能平均耶。
  次序變數也是一樣,我們不會說第一名和第二名平均起來得到1.5名這種事。當然,我們可以去計算某位選手生涯之中參賽平均得到的名次,但這個平均數對我們來說沒有什麼很重要的資訊。
  未來在提到不同統計方法的時候,也會不斷提到這幾種變數喔。
  

因為確診而躺了三天...本來想做圖的,但真的沒力氣了,等好點再補上吧。
[*1]: 其實有另一種變數叫做等比變數 (ratio variable),除了具有次序性、等間隔性之外,跟等距變數最大的差異在於有絕對0值。這篇提到的公分(長度)和秒數(時長)其實是屬於等比尺度,因為0公分代表沒有長度、0秒表示沒有時間長度,也就是絕對0的概念。真正的等距變數是具有等間隔性,但又沒有絕對0值的變數。例如攝氏溫度,攝氏0度不代表沒有溫度,只是那個溫度被我們定義為攝氏0度(冰點)。不過在社會科學裡面比較少嚴格區分等距與等比變數,基於這個急救箱的目的,文中就不做區分了。

參考文獻

顏志龍(2021):《傻瓜也會寫論文(量化+質化增訂版):社會科學學位論文寫作指南》。五南。
為什麼會看到廣告
avatar-img
52會員
32內容數
大學念文組,碩士班的報告突然要用統計了怎麼辦?沒學過統計怎麼寫量化學位論文?跟著統計書操作都沒問題,但報表都不知道在講什麼,也不知道做的分析到底對不對?作者在應用統計的路上跌跌撞撞也差不多十年了,希望有些心得可以幫助到有這些困擾的你。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
統計急救箱的沙龍 的其他內容
  在跑統計前的二三事─量化研究常見迷思 當中提到了一些量化研究的常見迷思,這篇想要簡單提一下跟統計有關的方法學子領域。   為什麼要提這個呢?因為有時候看起來像是統計的問題,其實在統計學裡面不一定能找到答案。如果不知道這類型的問題屬於哪個領域,就會連怎麼找資料都做不到。
  在回答過關於統計的問題裡面,有許多問題真正的癥結點其實不在統計能力上。所以就先從一些前情提要的觀念開始寫吧~   先搞懂統計才能做研究?量化與質化研究是什麼?顯著就是一切嗎?數學要很好才能學統計?這篇文章裡面都有討論。
最開始的想法其實只是想寫點筆記。 碩士畢業之後,隨著大數據的風潮而開始認真學起了統計學,過程中逐漸也弄懂了不少以前一知半解的事情。時常有著「當時要是有人告訴我這些就好了啊~」的感嘆,很怕自己沒寫下來就忘了,所以想記錄起來。
  在跑統計前的二三事─量化研究常見迷思 當中提到了一些量化研究的常見迷思,這篇想要簡單提一下跟統計有關的方法學子領域。   為什麼要提這個呢?因為有時候看起來像是統計的問題,其實在統計學裡面不一定能找到答案。如果不知道這類型的問題屬於哪個領域,就會連怎麼找資料都做不到。
  在回答過關於統計的問題裡面,有許多問題真正的癥結點其實不在統計能力上。所以就先從一些前情提要的觀念開始寫吧~   先搞懂統計才能做研究?量化與質化研究是什麼?顯著就是一切嗎?數學要很好才能學統計?這篇文章裡面都有討論。
最開始的想法其實只是想寫點筆記。 碩士畢業之後,隨著大數據的風潮而開始認真學起了統計學,過程中逐漸也弄懂了不少以前一知半解的事情。時常有著「當時要是有人告訴我這些就好了啊~」的感嘆,很怕自己沒寫下來就忘了,所以想記錄起來。
你可能也想看
Google News 追蹤
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
哈囉~很久沒跟各位自我介紹一下了~ 大家好~我是爺恩 我是一名圖文插畫家,有追蹤我一段時間的應該有發現爺恩這個品牌經營了好像.....快五年了(汗)時間過得真快!隨著時間過去,創作這件事好像變得更忙碌了,也很開心跟很多厲害的創作者以及廠商互相合作幫忙,還有最重要的是大家的支持與陪伴🥹。  
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
★★★先到自己電子郵件信箱下載教材上的圖片對照閱讀操作。 變數是保留在記憶體位置的儲存值,這意味著當我們創建一個變數,需要在記憶體中保留一些空間。 常數 程式中的變數其內容固定不會改變,通常以大寫英文字母命名,例如圓周率 PI = 3.14159。 基於變數的資料類型,解釋器會分配對應
在前一篇概略的介紹了抽象代數的架構,而這一篇就是來細談在那些部分,術數其實帶有代數性質。 運氣的演算 基本上術數,或任何占卜,最直接的目的就是在於計算某個事件中的「運氣值」,進而判斷吉凶。 用神喜忌等等 在東方陰陽五行的占卜中,最核心的技術概念就是用神跟五行氣的喜忌,最簡單的以代數的方式表示
Thumbnail
這篇內容,將會講解什麼是變數範圍,以及與變數範圍相關的知識。包括變數範圍的簡介、實體變數、全域變數、局部變數、常數。
Thumbnail
這篇內容,將會講解什麼是變數,以及與變數相關的知識。包括變數、資料型態、變數賦值、變數的命名規則、變數的作用區域、變數的可重複性、內建變數。
Thumbnail
直觀理解 導數:考慮的是單一變數的函數,描述的是函數在某點的斜率或變化率。 偏導數:考慮的是多變數函數,描述的是函數在某個變數變化時的變化率,其他變數保持不變。  (針對各維度的調整 或者稱變化 你要調多少) 應用 導數:在物理學中應用廣泛,例如描述速度和加速度。 偏導數:在多變量分析、優
前言: 雖然前面有些定義還沒有完整的解釋,但還是後面再說吧, 誰想一直看理論啊(摔本子)
※ 認識變數: 變數(variable)是在程式裡面把東西存起來的概念。 基於不讓電腦每次都需要重新運算,把需要花時間運算的東西先存起來,之後再直接拿出來使用,所以我們需要變數。 變數儲存的位置在電腦裡的記憶體。變數就像是一個箱子,記憶體就像是一個倉庫。箱子的名稱就是變數名稱,箱子的內容物就是
在求學階段,你已經對代數的計算熟到不能再熟,所以變數(variable)對你來說應該不至於太陌生,先來看看以下這個例子:   
Thumbnail
宣告變數 變數是程式中用來儲存和表示數據的標識符號​,並將變數存放在某個記憶體位子 可以用ID的方法查找變數存在哪個記憶體,此方法有利於以後查找問題用。 在大多數程式語言中,變數需要事先聲明(宣告)並賦值。 而Python是一種動態類型語言,不需要顯式宣告變數類型,而是在賦值時自動進行推斷。
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
哈囉~很久沒跟各位自我介紹一下了~ 大家好~我是爺恩 我是一名圖文插畫家,有追蹤我一段時間的應該有發現爺恩這個品牌經營了好像.....快五年了(汗)時間過得真快!隨著時間過去,創作這件事好像變得更忙碌了,也很開心跟很多厲害的創作者以及廠商互相合作幫忙,還有最重要的是大家的支持與陪伴🥹。  
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
★★★先到自己電子郵件信箱下載教材上的圖片對照閱讀操作。 變數是保留在記憶體位置的儲存值,這意味著當我們創建一個變數,需要在記憶體中保留一些空間。 常數 程式中的變數其內容固定不會改變,通常以大寫英文字母命名,例如圓周率 PI = 3.14159。 基於變數的資料類型,解釋器會分配對應
在前一篇概略的介紹了抽象代數的架構,而這一篇就是來細談在那些部分,術數其實帶有代數性質。 運氣的演算 基本上術數,或任何占卜,最直接的目的就是在於計算某個事件中的「運氣值」,進而判斷吉凶。 用神喜忌等等 在東方陰陽五行的占卜中,最核心的技術概念就是用神跟五行氣的喜忌,最簡單的以代數的方式表示
Thumbnail
這篇內容,將會講解什麼是變數範圍,以及與變數範圍相關的知識。包括變數範圍的簡介、實體變數、全域變數、局部變數、常數。
Thumbnail
這篇內容,將會講解什麼是變數,以及與變數相關的知識。包括變數、資料型態、變數賦值、變數的命名規則、變數的作用區域、變數的可重複性、內建變數。
Thumbnail
直觀理解 導數:考慮的是單一變數的函數,描述的是函數在某點的斜率或變化率。 偏導數:考慮的是多變數函數,描述的是函數在某個變數變化時的變化率,其他變數保持不變。  (針對各維度的調整 或者稱變化 你要調多少) 應用 導數:在物理學中應用廣泛,例如描述速度和加速度。 偏導數:在多變量分析、優
前言: 雖然前面有些定義還沒有完整的解釋,但還是後面再說吧, 誰想一直看理論啊(摔本子)
※ 認識變數: 變數(variable)是在程式裡面把東西存起來的概念。 基於不讓電腦每次都需要重新運算,把需要花時間運算的東西先存起來,之後再直接拿出來使用,所以我們需要變數。 變數儲存的位置在電腦裡的記憶體。變數就像是一個箱子,記憶體就像是一個倉庫。箱子的名稱就是變數名稱,箱子的內容物就是
在求學階段,你已經對代數的計算熟到不能再熟,所以變數(variable)對你來說應該不至於太陌生,先來看看以下這個例子:   
Thumbnail
宣告變數 變數是程式中用來儲存和表示數據的標識符號​,並將變數存放在某個記憶體位子 可以用ID的方法查找變數存在哪個記憶體,此方法有利於以後查找問題用。 在大多數程式語言中,變數需要事先聲明(宣告)並賦值。 而Python是一種動態類型語言,不需要顯式宣告變數類型,而是在賦值時自動進行推斷。
Thumbnail
第一堂學生創新團隊的點評 我們的統計在社會科學裡面,它到底是怎麼樣產生的,我們今天要算這個統計學,要送統計,他們本身要有Raw data,這樣才有辦法進行運用,如:我們要怎麼算平均身高如下是:   「全部身高」除以「人數」等於 每個人幾公分  所以我們要設計如何用電腦計算 ,要「input」