《大數據》:新的觀點、研究方法和看待世界的方式

閱讀時間約 2 分鐘
對量化研究而言,抽樣與選擇研究問題一樣重要。抽樣是重要的過程,如何選擇具有代表性的樣本,決定了是否可以做出正確的推論。甚至解釋因果關係,而不僅僅是發現變項間的相關。
但大數據要說的概念,恰恰與上述的研究方法與假設迥異。透過資料庫和資訊處理科學的發達,發展變相間的數據模型,推論母體變項間的相關,甚至可以取代因果關係,甚至提前做出預測。
書中舉了許多美國資料庫、系統商及商業物流管理的例子,說明抽樣的重要性如何被資料庫取代。而這樣的分析方法,是新興的商機,帶動的是更有效的預測行為。
對政府單位而言,握有諸多個別資料庫,擁有完整的個人資訊,在這個分析下,似乎可以做更多的事。提前為民眾設想合宜的政策,規劃更好的方案。
但大數據或者說資料庫的分析並不是沒有侷限。首先,資料庫的來源經常是我們不知道或未注意的。像是我們瀏覽各種購物網頁的點擊資訊,就被用來分析要推薦什麼商品;搜尋引擎做的拼字錯誤蒐集與校正,就成了改善輸入法的資料庫;搜尋引擎點擊的資訊,也影響著每字鍵入關鍵字搜尋得到的排序;使用各種衛星定位地圖的同時,也將相關的訊息透漏給提供服務的廠商;甚至在臉書上面的各種活動,也影響著臉書旁邊廣告連結的資訊。
可以想見,幾乎所有的免費線上服務,都是附帶的傳送了一些個人的偏好給系統廠商。而系統廠商也透過這些看似免費的服務,另外透過其他方式「獲得」服務費用。
而政府機關透過這些資訊,雖可能可以進行較好的政策分析,但個人的隱私、做為人的決定能動性,卻似乎在這樣的分析中被忽略了。偏好,變成了量化的數據,而量化的數據,經常很難解釋像你我一樣複雜的人。
當政府可以預測犯罪,並且預防犯罪時,是否也意味著容許政府「處罰」或「限制」可能進行犯罪行為的人。每一個動機犯,在這個資訊分析的時代,似乎也被凌駕、操縱甚至懷疑了。
而系統廠商蒐集這些關於個人的資訊,是否侵犯了個人的隱私,或者是否讓被蒐集的人知情後同意呢?
最後,社會科學研究如果邁入這樣的大數據分析,過去統計抽樣的方法,是備受挑戰的。如果不再使用問卷,我們的研究品質是否可以有效獲得提升呢?
當然,這本書並沒有明確的說明如何選擇合適的研究題目、確認合適的資料庫。而我也只是粗淺的讀完這本書,並沒有辦法提供延伸閱讀。有的話,就是他最近出的續集《大數據-隱私篇:數位時代,「刪去」是必要的美德》。
總之,是一本入門書,如果要進行研究,也許是一個新的發想的起始。以上。
為什麼會看到廣告
avatar-img
95會員
497內容數
講幹話是生活必須,除了拇指搭配我就爛微笑之外,還可以從新的角度,看待挫折,以及那些僥倖成功的人嘴裡吐出來的毒雞湯
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
老蔡書評的沙龍 的其他內容
僕が殺した人と僕を殺した人是一句很適合拿來學文法的句子(不對。他是一本好看、劇情緊湊的小說, 小說不準備談死刑存廢,卻平實的描述了一個精彩的故事。 翻開書頁,一度以為場景不若作者所言,在美國開始的雙軸線小說,帶讀者從頭開始進入作者的視角。青春期真摯的友誼,有的時候因為家庭環境而有了變化。那些大人的事
好久沒有寫書評了,因為忙著寫報告跟論文(誤)。為了寫論文,還有寫報告也看了一些可能不怎麼有趣的書。因為看了很多,報告又不怎麼好寫,所以決定寫一下書評(不到死線不認真寫)。 Fintech真的很熱門,也很新潮,就是這幾年不斷超展開的一項金融結合科技的技術,看他的英文字就知道是這兩個領域的小孩,如果你的
時隔半年多,不是這半年都不讀書,而是讀的書很難來個書評。準備研究所考試,也是偷閒看閒書。以下分享在下的心得,下一篇是舊書書評《鴻-三代中國女人的故事》。 說實話,這本書在當初太陽花運動的時候一時刮起一股旋風,本人也很流俗的買了。看到這裡想當然爾本人對這書的評價不是太好,就事論事談一下讀完的感想。 作
萬城目學是我一直以來滿喜歡的日本小說家之一,他的小說特色在於除了穿越得很自然之外,也挺詼諧有趣的。不生硬的結合一些日本特有的歷史、文化,讀起來有種特殊的趣味。 這本書大約是在講跟神這工作有關的事,日本的神道教跟一般台灣傳統信仰的道教某個部份是相似的,用這個做為故事的背景,然後描述一個神和專門採訪神的
一本從碩班同學手上A來看的書,主要介紹日本目前節葬的概念。 書一開頭介紹了葬禮的概況、節葬的概念和節葬的必要。在少子女化、高齡化的日本,慢慢面對著戰後嬰兒潮死亡的問題,以往家族的墓地、具有聯繫親友意義的喪禮,到底在已經高度工商社會化的日本,特別是都會地區,是否仍具有必要性。 當活人都不夠住了、活人要
首先感謝買書的少爺,讓我在暑假不想寫論文的時候偷空看完這本書。然後,近期身邊的朋友升格當媽的人數漸增,讓我也對媽媽這種生物感到特別的好奇,於是開啟了這段近似窺探有錢人生活的閱讀。 想知道有錢媽媽是過著什麼樣的上流生活嗎?你知道柏金包嗎?或者想知道他們的行為跟猩猩、狒狒還有某些鼠類等動物有哪些共同點
僕が殺した人と僕を殺した人是一句很適合拿來學文法的句子(不對。他是一本好看、劇情緊湊的小說, 小說不準備談死刑存廢,卻平實的描述了一個精彩的故事。 翻開書頁,一度以為場景不若作者所言,在美國開始的雙軸線小說,帶讀者從頭開始進入作者的視角。青春期真摯的友誼,有的時候因為家庭環境而有了變化。那些大人的事
好久沒有寫書評了,因為忙著寫報告跟論文(誤)。為了寫論文,還有寫報告也看了一些可能不怎麼有趣的書。因為看了很多,報告又不怎麼好寫,所以決定寫一下書評(不到死線不認真寫)。 Fintech真的很熱門,也很新潮,就是這幾年不斷超展開的一項金融結合科技的技術,看他的英文字就知道是這兩個領域的小孩,如果你的
時隔半年多,不是這半年都不讀書,而是讀的書很難來個書評。準備研究所考試,也是偷閒看閒書。以下分享在下的心得,下一篇是舊書書評《鴻-三代中國女人的故事》。 說實話,這本書在當初太陽花運動的時候一時刮起一股旋風,本人也很流俗的買了。看到這裡想當然爾本人對這書的評價不是太好,就事論事談一下讀完的感想。 作
萬城目學是我一直以來滿喜歡的日本小說家之一,他的小說特色在於除了穿越得很自然之外,也挺詼諧有趣的。不生硬的結合一些日本特有的歷史、文化,讀起來有種特殊的趣味。 這本書大約是在講跟神這工作有關的事,日本的神道教跟一般台灣傳統信仰的道教某個部份是相似的,用這個做為故事的背景,然後描述一個神和專門採訪神的
一本從碩班同學手上A來看的書,主要介紹日本目前節葬的概念。 書一開頭介紹了葬禮的概況、節葬的概念和節葬的必要。在少子女化、高齡化的日本,慢慢面對著戰後嬰兒潮死亡的問題,以往家族的墓地、具有聯繫親友意義的喪禮,到底在已經高度工商社會化的日本,特別是都會地區,是否仍具有必要性。 當活人都不夠住了、活人要
首先感謝買書的少爺,讓我在暑假不想寫論文的時候偷空看完這本書。然後,近期身邊的朋友升格當媽的人數漸增,讓我也對媽媽這種生物感到特別的好奇,於是開啟了這段近似窺探有錢人生活的閱讀。 想知道有錢媽媽是過著什麼樣的上流生活嗎?你知道柏金包嗎?或者想知道他們的行為跟猩猩、狒狒還有某些鼠類等動物有哪些共同點
你可能也想看
Google News 追蹤
大數據時代,統計學如何引領數據革命? 在大數據的時代,數據的數量和複雜性以前所未有的速度增長,這對統計學提出了前所未有的挑戰與機遇。隨著互聯網、物聯網(IoT)、社交媒體和傳感器技術的迅速發展,企業、政府以及個人生成的數據量以指數級增長。這些數據包含了多樣化的結構,如結構化數據、非結構化數據(如文
大數據分析技術概述 隨著數據量的迅速增長,傳統的數據分析方法已無法應對當前龐大、複雜的數據。大數據分析技術旨在通過先進的技術手段從海量數據中提取出有價值的信息,並將其應用於決策支持、業務洞察、預測分析等領域。以下是幾種關鍵的大數據分析技術。 1️⃣ 數據挖掘 (Data Mining) 數據
數據收集與預處理:關鍵步驟及方法 數據收集與預處理是數據科學與機器學習中至關重要的階段。這兩個過程不僅影響模型的精度,也對最終的決策產生深遠影響。以下將深入探討數據收集與預處理的流程、方法以及實際應用。 1️⃣ 數據收集:定義與方法 數據收集是將有價值的信息從不同來源(如傳感器、數據庫、互聯
Thumbnail
數據驅動的專案管理如何提升決策質量,涵蓋數據收集與管理、數據分析策略、實際應用技巧,以及面臨的挑戰和解決方案。通過描述性分析、診斷性分析、預測性分析和規範性分析,專案經理能夠優化資源分配、進度管理和風險控制,確保專案順利進行。
2-1 取得統計資料 統計學,指的就是搜集、整理、表現及分析資料的方法。 一般來說,當我們想要知道對於某件事,大眾的普遍想法時,我們可能會透過調查的方式,得到想要的答案。也就是說,我們可能透過問卷或者是電訪的方式,直接收集所要的母體資料。舉個例子來說,在總統選舉時,當侯選人舉辦政見發表會後,為了
Thumbnail
透過簡單的舉例,分享從原始資料到洞察發現的完整過程,包括資料清洗、特徵工程、探索性資料分析,以及如何根據分析結果提出具體建議。
Thumbnail
作為一名擁有多年經驗的數據分析師,我深知數據分析的重要性及其對企業決策的影響。然而,數據分析並不是在任何情況下都適用。今天我想跟你聊的事情是:在數據量不足或缺乏流程優化目的時,進行數據分析的局限性。
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
在當今數位化的商業環境中,新商品開發已經不再僅依賴傳統的市場調查和直覺決策。隨著大數據和人工智慧技術的迅速發展,數據驅動的開發策略成為推動創新和保持市場競爭力的關鍵。本文將探討如何利用數據驅動的方法來優化新商品開發流程,從而更有效地滿足消費者需求,提高產品成功率。
Thumbnail
有別於試圖直接從數據中找出洞察,商業分析的精髓在於先思考 so what——從定義目標開始,做出商業決策的雛形後,才用數據去支持假說。這篇文章介紹 A/B 測試的技巧,以及摘櫻桃的應用,解說數據篩選的操作、摘櫻桃的好處,以及企業案例:數位轉型後的報社,亞馬遜CEO貝佐斯改造百年郵報。
大數據時代,統計學如何引領數據革命? 在大數據的時代,數據的數量和複雜性以前所未有的速度增長,這對統計學提出了前所未有的挑戰與機遇。隨著互聯網、物聯網(IoT)、社交媒體和傳感器技術的迅速發展,企業、政府以及個人生成的數據量以指數級增長。這些數據包含了多樣化的結構,如結構化數據、非結構化數據(如文
大數據分析技術概述 隨著數據量的迅速增長,傳統的數據分析方法已無法應對當前龐大、複雜的數據。大數據分析技術旨在通過先進的技術手段從海量數據中提取出有價值的信息,並將其應用於決策支持、業務洞察、預測分析等領域。以下是幾種關鍵的大數據分析技術。 1️⃣ 數據挖掘 (Data Mining) 數據
數據收集與預處理:關鍵步驟及方法 數據收集與預處理是數據科學與機器學習中至關重要的階段。這兩個過程不僅影響模型的精度,也對最終的決策產生深遠影響。以下將深入探討數據收集與預處理的流程、方法以及實際應用。 1️⃣ 數據收集:定義與方法 數據收集是將有價值的信息從不同來源(如傳感器、數據庫、互聯
Thumbnail
數據驅動的專案管理如何提升決策質量,涵蓋數據收集與管理、數據分析策略、實際應用技巧,以及面臨的挑戰和解決方案。通過描述性分析、診斷性分析、預測性分析和規範性分析,專案經理能夠優化資源分配、進度管理和風險控制,確保專案順利進行。
2-1 取得統計資料 統計學,指的就是搜集、整理、表現及分析資料的方法。 一般來說,當我們想要知道對於某件事,大眾的普遍想法時,我們可能會透過調查的方式,得到想要的答案。也就是說,我們可能透過問卷或者是電訪的方式,直接收集所要的母體資料。舉個例子來說,在總統選舉時,當侯選人舉辦政見發表會後,為了
Thumbnail
透過簡單的舉例,分享從原始資料到洞察發現的完整過程,包括資料清洗、特徵工程、探索性資料分析,以及如何根據分析結果提出具體建議。
Thumbnail
作為一名擁有多年經驗的數據分析師,我深知數據分析的重要性及其對企業決策的影響。然而,數據分析並不是在任何情況下都適用。今天我想跟你聊的事情是:在數據量不足或缺乏流程優化目的時,進行數據分析的局限性。
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
在當今數位化的商業環境中,新商品開發已經不再僅依賴傳統的市場調查和直覺決策。隨著大數據和人工智慧技術的迅速發展,數據驅動的開發策略成為推動創新和保持市場競爭力的關鍵。本文將探討如何利用數據驅動的方法來優化新商品開發流程,從而更有效地滿足消費者需求,提高產品成功率。
Thumbnail
有別於試圖直接從數據中找出洞察,商業分析的精髓在於先思考 so what——從定義目標開始,做出商業決策的雛形後,才用數據去支持假說。這篇文章介紹 A/B 測試的技巧,以及摘櫻桃的應用,解說數據篩選的操作、摘櫻桃的好處,以及企業案例:數位轉型後的報社,亞馬遜CEO貝佐斯改造百年郵報。