文 / 食夢黑貘
當我們做出一個系統,最希望知道的是有沒有檢定判讀的能力,不然價值與意義就會少很多;而在做「未來國會」的時候,很多人問「網路聲量」是否能夠轉化成「得票數」、或者是否可以從「網路聲量更大」推論出「得票率可能更高」的關係,事實上我也是很好奇……。
所以就拿這次大選的結果來驗證一下吧!
首先一開始,就直接算出得票數與網路聲量的相關性(相關係數r值),得出來的答案是:
r = 0.41
這數字誠實說蠻沒有參考價值的,畢竟這數字說是有正相關沒錯,但通常定義是:
1. 低度相關性: |r| < 0.4(相關係數的絕對值小於0.4)
2. 顯著性相關: 0.4 <= |r| < 0.7(上述數值約在0.4和0.7之間)
3. 高度相關: |r| >= 0.7(上述數值大於0.7)
所以,「得票數」和「網路聲量」之間這個 0.41 的相關係數,真的只是剛好過了顯著相關的門檻,但要說是兩者有高度相關,真的無法說服別人。
但接下來我們在想這會是因為政黨的關係嗎? 所以就以不同政黨再算一次相關性,算出來結果如下:
(註:候選人低於 2 人的就沒辦法算,相關係數若是少於 2 人,係數一定是 1 或 -1,所以沒有意義;也因此台聯與新黨就沒辦法計算。)
此時就可以看到很有趣的數字:
1. 民進黨:得票數跟網路聲量幾乎可以判定是沒有相關,是比 0.4 還低的 0.23。
2. 國民黨:相關性也只是過 0.4 的 0.46,相關性也不算大。
3. 時代力量:相關係數高達 0.81,所以這真的代表它是「網路時代的政黨」嗎?
4. 親民黨:甚至高達 0.99;但主要是親民黨各單位在網路經營方面的落差相當大,認真經營地方的粉絲團也比較會經營網路,反之比較不認真經營的也容易在網路聲量方面「放牛吃草」。
5. 綠黨社會民主黨聯盟(綠社盟):得票與網路聲量相關性超低。
6. 民國黨:相關係數 0.04 可以說是無關了,或許因為廣告扭曲了這數字。
7. 信心希望聯盟:這是最有趣的政黨,網路聲量越高,得票數就越低,相關係數也高達 0.74,但是是負值;這是否可以證明這政黨的主張,完全無法在網路上受到檢驗?
8. 其他政黨我也沒認真去分析,但大家可以去看文末附上的原始資料連結,歡迎複製回去自己算。
但算完後我倒是很想畫個圖,只是一畫就發現,聲量高的政黨得票數字都很大,聲量小的都擠在一起;所以只好取對數再來畫,此時就會發現一個驚人的事實:事實上「聲量」和「得票」之間不是線性關係,而是指數關係。
此時再算一次指數的相關性(算法大致是「log(談論數) vs log(投票數)」),得到的結果是:
r = 0.74
就相關性而言,這個數字已經算是高度相關,這也代表政黨(或行銷者)如果沒有在網路上經營到一定程度,「聲量」很難回饋成「選票」。
換個角度來想,網路聲量雖然能夠跟得票數有相當大的關係,但通常也是要「足夠大」才行;甚至可能也是因為網路和傳統大眾媒體效應相互加乘,才有辦法讓網路聲量與得票數有明顯的正向關係。
回頭看對數的相關性,發現大部份政黨都沒有明顯差異,唯獨在「綠黨社會民主黨聯盟」身上,對數相關的現象最為明顯:相關係數從線性時 0.19 的「不顯著相關」,暴增至 0.54 的「顯著相關」。
所以,從上述的計算可以得出的簡單結論是:
1. 網路選戰的效果也是要看政黨,而「時代力量」可以說是個網路選戰的指標;相對的,民進黨的勝選從數字上來看,跟網路沒甚麼相關。
2. 網路聲量的確是可以做為得票數的先驗指標,只是有時對小黨更是個「門檻」。
3. 如果宣傳聲勢真的是用錢砸出來的,可能「網路聲量」和「得票數」的相關性就會很低。
4. 信心希望聯盟以後請不要在網路出現,請在教會宣傳就好。
雖然「未來國會」的真正重點不是在選舉,而是透過這樣的系統,讓我們知道國會在做甚麼、同時也透過這樣的系統,讓國會知道真正的民意。所以我們不只期待 2 月 1 日的新國會,「未來國會」也會在那時做一個改版,成為國會與人民之間的橋樑。
▲本計畫同步於Rocket Café網站同步募資,一起讓火箭升空吧!
文:食夢黑貘
是個工程師。水源地、生活情報網、蛋捲個人站、網路世代、人民公社/地下社會、捷運日記、MyZilla、部落格觀察、黑貘來說、部觀門、林克傳說、新文易數、未來國會……持續中。
那些媒體觀察家、SEO顧問、IT Consultant、CIO……都只是副業或頭銜。
封面圖片來源:張國耀