【超閱讀觀點18】從海量數據中找尋秘密--《數據、謊言與真相》

更新於 發佈於 閱讀時間約 4 分鐘

談到數據調查,以往我們的認知可能是拜託別人做問卷,然後回收再進行量化處理。但在歷經一段這麼辛苦的歷程後,更糟糕的是,所獲得的數據可能也不是最貼近現實的。

因為別人沒有坦誠的動機。

舉例來說,有關於瀏覽色情網站的調查,再怎麼詳盡,絕對沒有直接以色情網站直接獲得的數據來得真實,因為相較於問卷,直接瀏覽的行為絕對是最直接的,不會騙人。


raw-image


大數據越大就越好嗎?

這其實是個迷思,因為我們最需要獲得的,其實不是更多更大的數據,而是最正確的數據。Google在搜尋引擎方面,之所以能夠脫穎而出,靠的是能夠在第一頁,就能提供我們最符合搜尋字詞的訊息,所以如果我們沒辦法在大數據當中,解讀出獨特的見解,那麼獲取更多的數據,某種程度來說,只是獲取更多無用的垃圾。

大數據的作用:提供新類型的數據、誠實的數據、允許把焦點放在人口的小子集、提供因果關係。

作者認為,大數據最好是運用在傳統方法效率極差的市場裡,才能發揮最強威力。

事實可能不是你想得那樣

在賽馬領域,以往都是追溯血統與考量體型,來預測該賽馬未來是否會在賽場上大放異彩,但這方法其實用在NBA賽場上就知道,喬丹的兒子也沒能在NBA場上活躍XD。因此有數據學家專門評估馬的各種屬性,包含鼻孔大小、快縮肌體積、糞便重量等因素,是否與賽馬場上的表現有關聯,最後找到一個重要關鍵-左心室大小,後來這匹馬成為三冠王。

另外,看暴力電影會導致人們變得更暴力嗎?作者也以科學方式,驗證暴力電影上映期間,暴力案件是否有增加的趨勢,最後得出的結論是沒有。無論如何,以科學方式所得出的結論,總比「口說無憑」來得有說服力。

大數據真的無所不能嗎?非也。

作者提到「維度的詛咒」,如果你把一千枚硬幣編號,每天丟硬幣預測股市漲跌,發現丟到第三百九十一枚硬幣時,股市大漲機率高達百分之70.3,那以後只要丟這枚「第三百九十一號」的硬幣就能發大財嗎?絕對也是不行。

影響某事件的變數可能很多,如果把瞎貓碰上死耗子,誤認為瞎貓可以抓老鼠,那就會變得非常危險。

大數據的道德問題

比如書中提到,線上借款的網站,根據申請人的自述與最後還款表現,發現使用了「無債務、稅後、畢業」等字眼的人最有可能還款,使用「醫院、上帝、會還錢、承諾」等字眼的人,最不可能還款。那麼,以後可以不借款給提及「醫院」的人嗎?萬一他是真的有親人因病在醫院真的需要借錢呢?


西恩後見

這本書用數據解釋了「哪個地區的人出名機率較高?」「在NBA打出名堂真的是比較貧窮的人嗎?」「成績類似,最後有上好學校,會比唸次一等學校的人的人生際遇來得好嗎?」等非常有趣的問題。如果沒有數據佐證,大家勢必受到「刻板印象」影響,但事實可能並不是你想得那樣。

最後,西恩想到之前去上網路行銷的課,提到網頁跳出率,一般來說,網頁跳出率越高,代表那個網頁設計或是內容不太好,導致大家看到個網頁時決定跳出。但色情網站的跳出率越高,代表那個網頁很棒,至於為什麼?就有待大家用智慧思考。


西恩的文章都是花費時間閱讀、整理與提出心得,如果喜歡或是覺得有幫助到你,可以日行一善,在下方幫我按五下拍手鼓勵(化讚為賞幫助我)、留言(交流內心想法),或是按愛心(讓我知道有幫助到你),一起用實際行動,營造正向力量:)


留言
avatar-img
留言分享你的想法!
承熙-avatar-img
2021/12/29
西恩兄,你這篇忘了置入拍拍手喔^^
滾石西恩-avatar-img
發文者
2021/12/30
感謝承熙大提醒,已置入^^最近方格子文章發佈有調整,沒改到lol
avatar-img
滾石西恩的沙龍
94會員
154內容數
閱讀面向會包含時間管理、工作效率、習慣強化、閱讀寫作技巧與人際關係等面向,並希望整理不同作者的觀點,內化成自己的想法,打造適合自己的系統。如果這也是你(妳)追求的目標,歡迎一起加入。
滾石西恩的沙龍的其他內容
2025/03/29
很多人可能都這樣經驗:制定了完美的時間管理作息表,最後卻沒能完成,感嘆「時間管理」好難。 如果從管理角度看待「時間」,那麼可能從一開始就搞錯方向。 沒有人能夠管理時間,我們真正能管理的只有自己 《把時間當作朋友》作者李笑來說,「沒有人能夠管理時間,我們真正能管理的只有自己。」仔細思考,確實
Thumbnail
2025/03/29
很多人可能都這樣經驗:制定了完美的時間管理作息表,最後卻沒能完成,感嘆「時間管理」好難。 如果從管理角度看待「時間」,那麼可能從一開始就搞錯方向。 沒有人能夠管理時間,我們真正能管理的只有自己 《把時間當作朋友》作者李笑來說,「沒有人能夠管理時間,我們真正能管理的只有自己。」仔細思考,確實
Thumbnail
2024/02/17
《態度》、《見識》、《格局》是吳軍博士的人生進階三部曲套書,《如果只用十個字概括獲得大格局的方法,那就是「位置、方向、方法、步伐和節奏」,要能認清自己所在的位置和方向,並根據自己的能力掌握好節奏,提高進步速度,幾年後就會看到格局比今天大很的自己。
Thumbnail
2024/02/17
《態度》、《見識》、《格局》是吳軍博士的人生進階三部曲套書,《如果只用十個字概括獲得大格局的方法,那就是「位置、方向、方法、步伐和節奏」,要能認清自己所在的位置和方向,並根據自己的能力掌握好節奏,提高進步速度,幾年後就會看到格局比今天大很的自己。
Thumbnail
2024/02/09
在讀《給予:華頓商學院最啟發人心的一堂課》前,我在想一件事,「給予」總體來說,是正面的,應該是無庸置疑。給予代表幫助別人,沒有人會說不好,我們也常聽「吃虧就是占便宜」、「施比受更有福」,不過即使如此,「給予」看似簡單,其實並不是一件容易的事,如果在工作職場上,給予別人協助,有可能會損及自己的利益時,
Thumbnail
2024/02/09
在讀《給予:華頓商學院最啟發人心的一堂課》前,我在想一件事,「給予」總體來說,是正面的,應該是無庸置疑。給予代表幫助別人,沒有人會說不好,我們也常聽「吃虧就是占便宜」、「施比受更有福」,不過即使如此,「給予」看似簡單,其實並不是一件容易的事,如果在工作職場上,給予別人協助,有可能會損及自己的利益時,
Thumbnail
看更多
你可能也想看
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
班傑明.迪斯雷利:「世界上有三種謊言:謊言、該死的謊言,和統計數字。」 由於我們未知的東西可能至關重大,踏錯一步很可能導致理解不當或預測錯誤,對我們的健康、財產和福祉造成嚴重的後果。我們有理由對資料科學感到興奮,但必須抱持謹慎。唯一的解決之道就是瞭解風險,時時警覺。
Thumbnail
班傑明.迪斯雷利:「世界上有三種謊言:謊言、該死的謊言,和統計數字。」 由於我們未知的東西可能至關重大,踏錯一步很可能導致理解不當或預測錯誤,對我們的健康、財產和福祉造成嚴重的後果。我們有理由對資料科學感到興奮,但必須抱持謹慎。唯一的解決之道就是瞭解風險,時時警覺。
Thumbnail
《數據的假象:數據識讀是深度偽造時代最重要的思辨素養,聰明決策不被操弄》一書,作者是美國華盛頓大學的兩位教授Carl T. Bergstrom和Jevin D. West,內容分析當代常見的圖表、統計資料和數據,在日常生活展現出哪些面貌?又如何操控人心?
Thumbnail
《數據的假象:數據識讀是深度偽造時代最重要的思辨素養,聰明決策不被操弄》一書,作者是美國華盛頓大學的兩位教授Carl T. Bergstrom和Jevin D. West,內容分析當代常見的圖表、統計資料和數據,在日常生活展現出哪些面貌?又如何操控人心?
Thumbnail
  你以為沒人知道的,真的都藏好了嗎......
Thumbnail
  你以為沒人知道的,真的都藏好了嗎......
Thumbnail
談到數據調查,以往我們的認知可能是拜託別人做問卷,然後回收再進行量化處理。但在歷經一段這麼辛苦的歷程後,更糟糕的是,所獲得的數據可能也不是最貼近現實的。 因為別人沒有坦誠的動機。
Thumbnail
談到數據調查,以往我們的認知可能是拜託別人做問卷,然後回收再進行量化處理。但在歷經一段這麼辛苦的歷程後,更糟糕的是,所獲得的數據可能也不是最貼近現實的。 因為別人沒有坦誠的動機。
Thumbnail
每周一篇文章的讀書會心得報告摘要與筆記,本次分享文章為:只憑數字做決策的主管,小心了!忽視報表沒寫的資料,嚴重時恐鬧出人命: 1. 暗數據(dark data) 2. 漂亮的數據也別輕信,多方汲取、爬梳資料 3. 拒答、漏填也是一種資訊,加強隱私讓他們願意說
Thumbnail
每周一篇文章的讀書會心得報告摘要與筆記,本次分享文章為:只憑數字做決策的主管,小心了!忽視報表沒寫的資料,嚴重時恐鬧出人命: 1. 暗數據(dark data) 2. 漂亮的數據也別輕信,多方汲取、爬梳資料 3. 拒答、漏填也是一種資訊,加強隱私讓他們願意說
Thumbnail
以前剖開表皮,見到橘子果肉就心滿意足。現在則是連纖維都不容錯過。
Thumbnail
以前剖開表皮,見到橘子果肉就心滿意足。現在則是連纖維都不容錯過。
Thumbnail
「大數據像未成年性愛:人人湊熱鬧、沒人懂門道;人人以為別人在幹,搞得人人都說自己在幹。」在大數據開始對一般私部門使用者釋出時,這句話是最流行的笑話,至今不輟。
Thumbnail
「大數據像未成年性愛:人人湊熱鬧、沒人懂門道;人人以為別人在幹,搞得人人都說自己在幹。」在大數據開始對一般私部門使用者釋出時,這句話是最流行的笑話,至今不輟。
Thumbnail
大數據時代來臨,身為數學腦殘的我一直都有種焦慮感,最近感觸更深,比如說前陣子在吵的新冠肺炎確診人數以及疫苗副作用,為什麼大家資訊理解程度如此不對等,其實一部分就是因為目前社會上會解讀數據的人相當少,不理解數據的人各自解讀、互相爭吵...
Thumbnail
大數據時代來臨,身為數學腦殘的我一直都有種焦慮感,最近感觸更深,比如說前陣子在吵的新冠肺炎確診人數以及疫苗副作用,為什麼大家資訊理解程度如此不對等,其實一部分就是因為目前社會上會解讀數據的人相當少,不理解數據的人各自解讀、互相爭吵...
Thumbnail
書名全名為:《數據、謊言與真相:Google資料分析師用大數據揭露人們的真面目》。作者以大數據分析自谷歌搜尋蒐集之關於「種族歧視」相關搜尋為開端,探討大眾主觀認知與現實產生落差的肇因,剖析造成刻板印象與真實面間差距的心理學成因,並論及大數據分析之應用領域及可能牽涉的道德問題。
Thumbnail
書名全名為:《數據、謊言與真相:Google資料分析師用大數據揭露人們的真面目》。作者以大數據分析自谷歌搜尋蒐集之關於「種族歧視」相關搜尋為開端,探討大眾主觀認知與現實產生落差的肇因,剖析造成刻板印象與真實面間差距的心理學成因,並論及大數據分析之應用領域及可能牽涉的道德問題。
Thumbnail
電腦不懂思考,會思考、留意公平與否的是人腦,締造一個公正幸福社會,不能依賴電腦和演算法。
Thumbnail
電腦不懂思考,會思考、留意公平與否的是人腦,締造一個公正幸福社會,不能依賴電腦和演算法。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News