【超閱讀觀點18】從海量數據中找尋秘密--《數據、謊言與真相》

更新於 發佈於 閱讀時間約 3 分鐘
談到數據調查,以往我們的認知可能是拜託別人做問卷,然後回收再進行量化處理。但在歷經一段這麼辛苦的歷程後,更糟糕的是,所獲得的數據可能也不是最貼近現實的。
因為別人沒有坦誠的動機。
舉例來說,有關於瀏覽色情網站的調查,再怎麼詳盡,絕對沒有直接以色情網站直接獲得的數據來得真實,因為相較於問卷,直接瀏覽的行為絕對是最直接的,不會騙人。

大數據越大就越好嗎?

這其實是個迷思,因為我們最需要獲得的,其實不是更多更大的數據,而是最正確的數據。Google在搜尋引擎方面,之所以能夠脫穎而出,靠的是能夠在第一頁,就能提供我們最符合搜尋字詞的訊息,所以如果我們沒辦法在大數據當中,解讀出獨特的見解,那麼獲取更多的數據,某種程度來說,只是獲取更多無用的垃圾。
大數據的作用:提供新類型的數據、誠實的數據、允許把焦點放在人口的小子集、提供因果關係。
作者認為,大數據最好是運用在傳統方法效率極差的市場裡,才能發揮最強威力。

事實可能不是你想得那樣

在賽馬領域,以往都是追溯血統與考量體型,來預測該賽馬未來是否會在賽場上大放異彩,但這方法其實用在NBA賽場上就知道,喬丹的兒子也沒能在NBA場上活躍XD。因此有數據學家專門評估馬的各種屬性,包含鼻孔大小、快縮肌體積、糞便重量等因素,是否與賽馬場上的表現有關聯,最後找到一個重要關鍵-左心室大小,後來這匹馬成為三冠王。
另外,看暴力電影會導致人們變得更暴力嗎?作者也以科學方式,驗證暴力電影上映期間,暴力案件是否有增加的趨勢,最後得出的結論是沒有。無論如何,以科學方式所得出的結論,總比「口說無憑」來得有說服力。

大數據真的無所不能嗎?非也。

作者提到「維度的詛咒」,如果你把一千枚硬幣編號,每天丟硬幣預測股市漲跌,發現丟到第三百九十一枚硬幣時,股市大漲機率高達百分之70.3,那以後只要丟這枚「第三百九十一號」的硬幣就能發大財嗎?絕對也是不行。
影響某事件的變數可能很多,如果把瞎貓碰上死耗子,誤認為瞎貓可以抓老鼠,那就會變得非常危險。

大數據的道德問題

比如書中提到,線上借款的網站,根據申請人的自述與最後還款表現,發現使用了「無債務、稅後、畢業」等字眼的人最有可能還款,使用「醫院、上帝、會還錢、承諾」等字眼的人,最不可能還款。那麼,以後可以不借款給提及「醫院」的人嗎?萬一他是真的有親人因病在醫院真的需要借錢呢?

西恩後見

這本書用數據解釋了「哪個地區的人出名機率較高?」「在NBA打出名堂真的是比較貧窮的人嗎?」「成績類似,最後有上好學校,會比唸次一等學校的人的人生際遇來得好嗎?」等非常有趣的問題。如果沒有數據佐證,大家勢必受到「刻板印象」影響,但事實可能並不是你想得那樣。
最後,西恩想到之前去上網路行銷的課,提到網頁跳出率,一般來說,網頁跳出率越高,代表那個網頁設計或是內容不太好,導致大家看到個網頁時決定跳出。但色情網站的跳出率越高,代表那個網頁很棒,至於為什麼?就有待大家用智慧思考。
西恩的文章都是花費時間閱讀、整理與提出心得,如果喜歡或是覺得有幫助到你,可以日行一善,在下方幫我按五下拍手鼓勵(化讚為賞幫助我)、留言(交流內心想法),或是按愛心(讓我知道有幫助到你),一起用實際行動,營造正向力量:)
為什麼會看到廣告
avatar-img
86會員
139內容數
閱讀面向會包含時間管理、工作效率、習慣強化、閱讀寫作技巧與人際關係等面向,並希望整理不同作者的觀點,內化成自己的想法,打造適合自己的系統。如果這也是你(妳)追求的目標,歡迎一起加入。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
滾石西恩的沙龍 的其他內容
忘了在哪本書上看到作者推薦這本書,在加入待閱讀清單後,一直沒看,直到準備再次接任主管後,把這本書看了兩次。 高效率只是「快」,高效能是「又快又好」,要學習如何做「對」的事,而不單把事做對。
小時候在學校,我們被強迫學習;長大後進入社會,才發現有好多學校沒教的事,學無止境,只是這個過程中,常常會遭遇挫敗,讓學習原地轉圈。 《學得快才會想學!:黃金20小時學習法》這本書,有點像《刻意練習》簡配版,沒有什麼研究數據,只有作者親身體驗,全書283頁,談怎麼學習只有49頁,後面頁數作者直接展示他
看這本名為《如何閱讀一本書》的書,就像在做「如何怎麼做簡報」的簡報一樣,在看之前,絕對會充滿疑惑的。 「如果我不會閱讀一本書,那我要怎麼閱讀這本書?」、「如果我已經會閱讀這本書,那我幹嘛閱讀這本書?」這邊引用書中所提到蒙田所說的「初學者的無知在於未學,而學者的無知在於學後」。
為什麼要看《一流的人讀書,都在哪裡畫線?:菁英閱讀的深思考技術》這本書? 人的精力跟生命都有限,開始寫作輸出後,更深覺輸入的重要性,因此想要藉由此書,了解如何更快速抓住閱讀重點。 本書適合 想要提升閱讀效率、想Get成長書單、了解商業經營的人 其實,我們可能都畫錯線了XD 話說電子書真的很方便
古人說「書中自有顏如玉」,鼓勵我們多看書;但古人又說「讀萬卷書不如走萬里路」,搞得我好亂啊!到底是要看書還是不要看書? 《問題背後的問題》教我遇到事情不要先問「Why」,直到我看到《先問,為什麼?顛覆慣性思考的黃金圈理論,啟動你的感召領導力》...不禁納悶,請問我遇到事情,到底要先問為什麼還是不?
忘了在哪本書上看到作者推薦這本書,在加入待閱讀清單後,一直沒看,直到準備再次接任主管後,把這本書看了兩次。 高效率只是「快」,高效能是「又快又好」,要學習如何做「對」的事,而不單把事做對。
小時候在學校,我們被強迫學習;長大後進入社會,才發現有好多學校沒教的事,學無止境,只是這個過程中,常常會遭遇挫敗,讓學習原地轉圈。 《學得快才會想學!:黃金20小時學習法》這本書,有點像《刻意練習》簡配版,沒有什麼研究數據,只有作者親身體驗,全書283頁,談怎麼學習只有49頁,後面頁數作者直接展示他
看這本名為《如何閱讀一本書》的書,就像在做「如何怎麼做簡報」的簡報一樣,在看之前,絕對會充滿疑惑的。 「如果我不會閱讀一本書,那我要怎麼閱讀這本書?」、「如果我已經會閱讀這本書,那我幹嘛閱讀這本書?」這邊引用書中所提到蒙田所說的「初學者的無知在於未學,而學者的無知在於學後」。
為什麼要看《一流的人讀書,都在哪裡畫線?:菁英閱讀的深思考技術》這本書? 人的精力跟生命都有限,開始寫作輸出後,更深覺輸入的重要性,因此想要藉由此書,了解如何更快速抓住閱讀重點。 本書適合 想要提升閱讀效率、想Get成長書單、了解商業經營的人 其實,我們可能都畫錯線了XD 話說電子書真的很方便
古人說「書中自有顏如玉」,鼓勵我們多看書;但古人又說「讀萬卷書不如走萬里路」,搞得我好亂啊!到底是要看書還是不要看書? 《問題背後的問題》教我遇到事情不要先問「Why」,直到我看到《先問,為什麼?顛覆慣性思考的黃金圈理論,啟動你的感召領導力》...不禁納悶,請問我遇到事情,到底要先問為什麼還是不?
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
社群媒體會導致「過濾氣泡」和「同溫層效應」。也就是說,這只會讓用戶只看到符合其既有觀點和興趣的內容,從而錯過多樣化的信息。 如果要做出更妥善的市場判斷,除了需要在即時的數據和長期的品牌價值之間找到平衡,也要提醒大家要及時『抽身』回到真實的世界中,才能避免陷入數據迷戀和演算法偏見。
Thumbnail
在流量為王的網路時代,有多少網路工作者被瀏覽數及追蹤數等數據所掌控? 又有多少人會以網路流量為評斷依據,判斷究竟一個人說出口的話「有沒有價值」? 在面對一項人事物時,不少人都容易簡單粗略地以「外在價值」來做評斷, 但價值其實不僅僅存在於外在、可量化的,更多的是隱藏在內、難以量化的深度價值。
Thumbnail
魔球記載MLB奧克蘭運動家隊的真實故事。該隊以小搏大,用數據思維選出一批從未被看好的球員,打出最瘋狂的佳績。 這本是經典老書了,書中細節大家已多有討論,我只著重在「統計數據」與「新舊觀念衝突」兩部分。透過魔球的精神,反思今天科技時代下「人」或「人才」的價值,我也會表達我對一個大趨勢形成的看法。
Thumbnail
作為一名擁有多年經驗的數據分析師,我深知數據分析的重要性及其對企業決策的影響。然而,數據分析並不是在任何情況下都適用。今天我想跟你聊的事情是:在數據量不足或缺乏流程優化目的時,進行數據分析的局限性。
Thumbnail
對不感興趣的推薦,不要有任何反應,必須練習無視的任它來去。 敬一杯,自由的難能可貴,一切的並非理所當然!
Thumbnail
這本書討論了數據應用中的暗數據,探討了遺漏的資訊或數據對數據分析的影響。書中列舉了很多有趣的例子,但同時也提到暗數據仍具有價值和發現真相的可能。對於對調查研究有興趣的讀者來說很有價值,需要具備一定的統計基礎。作者強調懷疑數據的重要性,以避免暗數據的影響。
Thumbnail
#週一推薦 #行銷人必學 數據洞察行銷的專場分享 面對瞬息萬變的數據行銷時代,您準備好了嗎? 在我眼中,沒有難做的市場,只有看不見的藍海 而準確的線上數據越來越能夠協助我們洞悉商機 #消費者旅程的洞察 隨著第三方cookie消失|各大品牌和電商積極收集從公領域轉到私領域流量的數據,如果線上和
Thumbnail
這是一本關於美國大聯盟奧克蘭運動家隊的總經理與助理,利用大數據進行球員挑選的故事。書中揭示了棒球統計對球員挑選和球隊經營的重要性,呈現了大數據時代的棒球故事。
1.5 Date Techonlogy DT時代的特徵是體驗,體驗就是感受。顧客要的不是服務,顧客要的是體驗。 2.4 在大數據時代,企業必須運用DT技術從資料收集至中探索巨大的價值,因為它能夠讓企業比顧客更懂顧客。DT技術運用方式 一、自動預測趨勢和行為 二、關聯性分析 三、分群
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
社群媒體會導致「過濾氣泡」和「同溫層效應」。也就是說,這只會讓用戶只看到符合其既有觀點和興趣的內容,從而錯過多樣化的信息。 如果要做出更妥善的市場判斷,除了需要在即時的數據和長期的品牌價值之間找到平衡,也要提醒大家要及時『抽身』回到真實的世界中,才能避免陷入數據迷戀和演算法偏見。
Thumbnail
在流量為王的網路時代,有多少網路工作者被瀏覽數及追蹤數等數據所掌控? 又有多少人會以網路流量為評斷依據,判斷究竟一個人說出口的話「有沒有價值」? 在面對一項人事物時,不少人都容易簡單粗略地以「外在價值」來做評斷, 但價值其實不僅僅存在於外在、可量化的,更多的是隱藏在內、難以量化的深度價值。
Thumbnail
魔球記載MLB奧克蘭運動家隊的真實故事。該隊以小搏大,用數據思維選出一批從未被看好的球員,打出最瘋狂的佳績。 這本是經典老書了,書中細節大家已多有討論,我只著重在「統計數據」與「新舊觀念衝突」兩部分。透過魔球的精神,反思今天科技時代下「人」或「人才」的價值,我也會表達我對一個大趨勢形成的看法。
Thumbnail
作為一名擁有多年經驗的數據分析師,我深知數據分析的重要性及其對企業決策的影響。然而,數據分析並不是在任何情況下都適用。今天我想跟你聊的事情是:在數據量不足或缺乏流程優化目的時,進行數據分析的局限性。
Thumbnail
對不感興趣的推薦,不要有任何反應,必須練習無視的任它來去。 敬一杯,自由的難能可貴,一切的並非理所當然!
Thumbnail
這本書討論了數據應用中的暗數據,探討了遺漏的資訊或數據對數據分析的影響。書中列舉了很多有趣的例子,但同時也提到暗數據仍具有價值和發現真相的可能。對於對調查研究有興趣的讀者來說很有價值,需要具備一定的統計基礎。作者強調懷疑數據的重要性,以避免暗數據的影響。
Thumbnail
#週一推薦 #行銷人必學 數據洞察行銷的專場分享 面對瞬息萬變的數據行銷時代,您準備好了嗎? 在我眼中,沒有難做的市場,只有看不見的藍海 而準確的線上數據越來越能夠協助我們洞悉商機 #消費者旅程的洞察 隨著第三方cookie消失|各大品牌和電商積極收集從公領域轉到私領域流量的數據,如果線上和
Thumbnail
這是一本關於美國大聯盟奧克蘭運動家隊的總經理與助理,利用大數據進行球員挑選的故事。書中揭示了棒球統計對球員挑選和球隊經營的重要性,呈現了大數據時代的棒球故事。
1.5 Date Techonlogy DT時代的特徵是體驗,體驗就是感受。顧客要的不是服務,顧客要的是體驗。 2.4 在大數據時代,企業必須運用DT技術從資料收集至中探索巨大的價值,因為它能夠讓企業比顧客更懂顧客。DT技術運用方式 一、自動預測趨勢和行為 二、關聯性分析 三、分群