淺談大數據

更新 發佈閱讀 4 分鐘

Q1. 大數據的特徵是什麼?

Q2. 大數據思維的特徵是什麼?

Q3. 世界的本質是數據和計算嗎?

Q4. 科學研究最新 (第四) 範式 (paradigm) 是什麼?

raw-image

對Q1-Q4的回答如下:

古希臘畢達格拉斯主張數是萬物的本原, 萬事萬物都是對於數的模仿; 他用抽象思維中的數說明具體感官世界的事物, 由數學神秘主義引出宗教神秘主義。

兩千多年後的21世紀, 大數據技術革命也將人類帶向一個新的時代-大數據時代。數據代替了數, 成為人們崇仰的新偶像, 形成以大數據為核心的準宗教神秘主義。

raw-image

例如: 大數據理論家荀柏格 (V. Mayer-Schonberger) 說:「世界的本質就是數據; 一切皆可量化」; 知名的五三八民意調查網站站主 N. Silver 說:「訊號就是真理」; 麥克阿瑟天才獎得主與數學軟體 Mathematica 設計人 S. Wolfram 說:「宇宙的本質是計算, 宇宙的一切規律都可以經由簡單程序的反覆計算而獲得」等。

將 (大) 數據以及其中的訊號和計算當成世界的本質, 只是主觀的想像、猜測或推理, 並無客觀的可驗證性。這種本體論的陳述在20世紀已經被分析哲學家們認為不具有意義而被拒斥。

大數據真正的意義不在於狂妄的上探本體 (哲學家康德的本體不可知論是較謙卑的選擇) 而在於對現象世界認識的界碑的向外巨大推移, 在於認識論上的方法學突破, 其重要性在於如同圖靈獎得主格雷 (J. Gray ) 所言:「大數據技術帶來了繼經驗科學、理論科學和模擬計算科學後的科學研究第四範式-稱為數據密集型科學研究範式」。

因為大數據離不開計算, 例如演算法 (為計算統計computational statistics、機器學習、數據採礦、人工智能 AI 等的前提基礎)、模擬法 (simulation) 及雲端計算等-皆為當代的主流顯學-所以第四範式的核心特徵可以用「大數據計算主義」概括。

從海量駁雜數據中尋找數據規律以發現對應的現象世界-自然世界或者人類社會-的規律是當代的重大課題。據估計, 大數據中絕大多數都是屬於從大紀錄而來的非結構型、半結構型或者異質結構型數據, 這對於傳統上處理從小測量而來的結構型數據的機率和統計思維和方法形成嚴峻的挑戰。

顯然地,大數據思維是要藉由巨量數據去描述和了解世界、發現和解決問題以及預測未來;它必定是辯證地繼承和發展 (繼承中有揚棄、發展中有保留) 機率和統計思維。

換個角度看,統計要成功地回應大數據的挑戰,就必定要「在研究範圍 (對象) 和分析方法上不斷擴展。… 數據導向的、基於演算法的數據分析方法成為電算機時代統計學發展無法迴避的一個重要趨勢」[註1]。

raw-image

大數據的特徵一般是以4V: Volume, Variety, Velocity, Veracity表示之,即數據量巨大(處理起來計算量龐大); 數據種類駁雜多樣;數據蒐集、儲存、處理及傳輸速度快 (多須自動化處理);數據真實性及準確性可疑 (含有雜訊、錯誤及模糊性);有人用大、雜、快、疑這四個字來加以概括。

從大數據特徵的描述中可以知道: 在理性思維方面, 除了繼承和發展機率和統計思維, 大數據思維還必須融入複雜性思維及實用主義思維-這三類相異卻又內在相聯繫思維方式的辯證統一是其發展的必然方向; 在非理性感性方面, 除了繼承機率和統計所包含的非理性感性因素, 還必須融入具有後現代主義色彩的一些因素諸如雜多性、模糊性、混亂性、非結構性、碎片性等。

[註1] 魏瑾瑞、蔣萍 (2014)。數據科學的統計學内涵。統計研究, 31, pp.3-9。


本文圖片轉載自: group.dailyview.tw/article/detail/682www.largitdata.com/blog_detail/20190725http://medium.com/....../%E8%B3%87%E6%96%99%E7%A7%91......

留言
avatar-img
留言分享你的想法!
avatar-img
吳鐵肩的沙龍
128會員
56內容數
吳鐵肩的沙龍的其他內容
2024/07/06
「善有善報、惡有惡報」是真的嗎?本文旨在回答這個問題-破除「善惡因果律 (或稱道德因果律)」的迷思,分析其心理、情感、信仰的基礎,並指出「德福一致」在社會實踐的幾個可能方向。
Thumbnail
2024/07/06
「善有善報、惡有惡報」是真的嗎?本文旨在回答這個問題-破除「善惡因果律 (或稱道德因果律)」的迷思,分析其心理、情感、信仰的基礎,並指出「德福一致」在社會實踐的幾個可能方向。
Thumbnail
2024/05/12
母愛對子女雖十分重要,但道德上並非真正偉大。本文目的是解構「偉大母愛」與「母親節」的信條-它們已被資本家、商家宣傳炒作而異化成為商品,鼓動了母親節消費狂熱與濫情氛圍。以下從親子相互意義、「偉大」必要條件、前衛女性對母愛的質疑、商家的炒作這四面向來論述 2024母親節來臨,兒女都在這一天替母親慶祝
Thumbnail
2024/05/12
母愛對子女雖十分重要,但道德上並非真正偉大。本文目的是解構「偉大母愛」與「母親節」的信條-它們已被資本家、商家宣傳炒作而異化成為商品,鼓動了母親節消費狂熱與濫情氛圍。以下從親子相互意義、「偉大」必要條件、前衛女性對母愛的質疑、商家的炒作這四面向來論述 2024母親節來臨,兒女都在這一天替母親慶祝
Thumbnail
2024/04/26
( 已刊載於 2024-04-21 01:16 聯合報/民意論壇) 中國崛起,要實現「中華民族偉大復興」,與美國爭雄,是本世紀全球最重大的事件;準總統賴清德宣誓上任後要做的「國家重建、社會改造、洗滌每一個人的人心」,則是近日台灣重大事件。從對立事件發生機率的起伏消長,或可一窺未來歷史發展的可能方向。
Thumbnail
2024/04/26
( 已刊載於 2024-04-21 01:16 聯合報/民意論壇) 中國崛起,要實現「中華民族偉大復興」,與美國爭雄,是本世紀全球最重大的事件;準總統賴清德宣誓上任後要做的「國家重建、社會改造、洗滌每一個人的人心」,則是近日台灣重大事件。從對立事件發生機率的起伏消長,或可一窺未來歷史發展的可能方向。
Thumbnail
看更多
你可能也想看
Thumbnail
覺得黏在額頭上的"條碼瀏海"很阿雜嗎?日本熱銷的「KOIZUMI迷你瀏海梳」,不僅小巧便攜,更能快速加熱造型,無論是齊瀏海、空氣瀏海還是韓系碎蓋髮,都能輕鬆打理!瀏海順了,一整天心情就好了!
Thumbnail
覺得黏在額頭上的"條碼瀏海"很阿雜嗎?日本熱銷的「KOIZUMI迷你瀏海梳」,不僅小巧便攜,更能快速加熱造型,無論是齊瀏海、空氣瀏海還是韓系碎蓋髮,都能輕鬆打理!瀏海順了,一整天心情就好了!
Thumbnail
走完朝聖之路和TMB後,我發現真正能撐住長時間健行的,不只是腳力,而是那些讓生活更舒服的小物。這篇整理了我在TMB實測後覺得超好用的三樣登山神器——防水襪、肥皂袋、速乾毛巾,每一樣都讓旅程更輕鬆!
Thumbnail
走完朝聖之路和TMB後,我發現真正能撐住長時間健行的,不只是腳力,而是那些讓生活更舒服的小物。這篇整理了我在TMB實測後覺得超好用的三樣登山神器——防水襪、肥皂袋、速乾毛巾,每一樣都讓旅程更輕鬆!
Thumbnail
Q1. 大數據的特徵是什麼? Q2. 大數據思維的特徵是什麼? Q3. 世界的本質是數據和計算嗎? Q4. 科學研究最新 (第四) 範式 (paradigm) 是什麼? 本文回答以上四個問題。
Thumbnail
Q1. 大數據的特徵是什麼? Q2. 大數據思維的特徵是什麼? Q3. 世界的本質是數據和計算嗎? Q4. 科學研究最新 (第四) 範式 (paradigm) 是什麼? 本文回答以上四個問題。
Thumbnail
若你想一窺數據世界的全局及趨勢很適合閱讀此書,這篇文章也會和大家分享幾個有意思的觀點。大數據讓人們對於社會及商業模式有了全新的角度,但數據的複雜性也帶來更大的挑戰。
Thumbnail
若你想一窺數據世界的全局及趨勢很適合閱讀此書,這篇文章也會和大家分享幾個有意思的觀點。大數據讓人們對於社會及商業模式有了全新的角度,但數據的複雜性也帶來更大的挑戰。
Thumbnail
一、從大數據孕育出人工智能 (AI)。 二、宏觀角度-人異化成為數據及演算法之奴。 歐尼爾的警告:最安静的恐怖主義。 哈拉瑞的警告:數據主義和神人統治論。 三、微觀角度-人異化成為自己的陌生人、真實世界的陌生客。 網路大數據與 AI 是新型的精神舞台與精神鴉片。 網民變得稚萌淺薄,語言表達能力退化。
Thumbnail
一、從大數據孕育出人工智能 (AI)。 二、宏觀角度-人異化成為數據及演算法之奴。 歐尼爾的警告:最安静的恐怖主義。 哈拉瑞的警告:數據主義和神人統治論。 三、微觀角度-人異化成為自己的陌生人、真實世界的陌生客。 網路大數據與 AI 是新型的精神舞台與精神鴉片。 網民變得稚萌淺薄,語言表達能力退化。
Thumbnail
用數據藝術說故事,解構資訊時代的暗黑力量 我數據你;你數據我。他們數據我們;我們數據他們。 ~~我們全都數據在一起~~
Thumbnail
用數據藝術說故事,解構資訊時代的暗黑力量 我數據你;你數據我。他們數據我們;我們數據他們。 ~~我們全都數據在一起~~
Thumbnail
以前剖開表皮,見到橘子果肉就心滿意足。現在則是連纖維都不容錯過。
Thumbnail
以前剖開表皮,見到橘子果肉就心滿意足。現在則是連纖維都不容錯過。
Thumbnail
大數據時代來臨,身為數學腦殘的我一直都有種焦慮感,最近感觸更深,比如說前陣子在吵的新冠肺炎確診人數以及疫苗副作用,為什麼大家資訊理解程度如此不對等,其實一部分就是因為目前社會上會解讀數據的人相當少,不理解數據的人各自解讀、互相爭吵...
Thumbnail
大數據時代來臨,身為數學腦殘的我一直都有種焦慮感,最近感觸更深,比如說前陣子在吵的新冠肺炎確診人數以及疫苗副作用,為什麼大家資訊理解程度如此不對等,其實一部分就是因為目前社會上會解讀數據的人相當少,不理解數據的人各自解讀、互相爭吵...
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News