淺談大數據

更新於 發佈於 閱讀時間約 4 分鐘

Q1. 大數據的特徵是什麼?

Q2. 大數據思維的特徵是什麼?

Q3. 世界的本質是數據和計算嗎?

Q4. 科學研究最新 (第四) 範式 (paradigm) 是什麼?

raw-image

對Q1-Q4的回答如下:

古希臘畢達格拉斯主張數是萬物的本原, 萬事萬物都是對於數的模仿; 他用抽象思維中的數說明具體感官世界的事物, 由數學神秘主義引出宗教神秘主義。

兩千多年後的21世紀, 大數據技術革命也將人類帶向一個新的時代-大數據時代。數據代替了數, 成為人們崇仰的新偶像, 形成以大數據為核心的準宗教神秘主義。

raw-image

例如: 大數據理論家荀柏格 (V. Mayer-Schonberger) 說:「世界的本質就是數據; 一切皆可量化」; 知名的五三八民意調查網站站主 N. Silver 說:「訊號就是真理」; 麥克阿瑟天才獎得主與數學軟體 Mathematica 設計人 S. Wolfram 說:「宇宙的本質是計算, 宇宙的一切規律都可以經由簡單程序的反覆計算而獲得」等。

將 (大) 數據以及其中的訊號和計算當成世界的本質, 只是主觀的想像、猜測或推理, 並無客觀的可驗證性。這種本體論的陳述在20世紀已經被分析哲學家們認為不具有意義而被拒斥。

大數據真正的意義不在於狂妄的上探本體 (哲學家康德的本體不可知論是較謙卑的選擇) 而在於對現象世界認識的界碑的向外巨大推移, 在於認識論上的方法學突破, 其重要性在於如同圖靈獎得主格雷 (J. Gray ) 所言:「大數據技術帶來了繼經驗科學、理論科學和模擬計算科學後的科學研究第四範式-稱為數據密集型科學研究範式」。

因為大數據離不開計算, 例如演算法 (為計算統計computational statistics、機器學習、數據採礦、人工智能 AI 等的前提基礎)、模擬法 (simulation) 及雲端計算等-皆為當代的主流顯學-所以第四範式的核心特徵可以用「大數據計算主義」概括。

從海量駁雜數據中尋找數據規律以發現對應的現象世界-自然世界或者人類社會-的規律是當代的重大課題。據估計, 大數據中絕大多數都是屬於從大紀錄而來的非結構型、半結構型或者異質結構型數據, 這對於傳統上處理從小測量而來的結構型數據的機率和統計思維和方法形成嚴峻的挑戰。

顯然地,大數據思維是要藉由巨量數據去描述和了解世界、發現和解決問題以及預測未來;它必定是辯證地繼承和發展 (繼承中有揚棄、發展中有保留) 機率和統計思維。

換個角度看,統計要成功地回應大數據的挑戰,就必定要「在研究範圍 (對象) 和分析方法上不斷擴展。… 數據導向的、基於演算法的數據分析方法成為電算機時代統計學發展無法迴避的一個重要趨勢」[註1]。

raw-image

大數據的特徵一般是以4V: Volume, Variety, Velocity, Veracity表示之,即數據量巨大(處理起來計算量龐大); 數據種類駁雜多樣;數據蒐集、儲存、處理及傳輸速度快 (多須自動化處理);數據真實性及準確性可疑 (含有雜訊、錯誤及模糊性);有人用大、雜、快、疑這四個字來加以概括。

從大數據特徵的描述中可以知道: 在理性思維方面, 除了繼承和發展機率和統計思維, 大數據思維還必須融入複雜性思維及實用主義思維-這三類相異卻又內在相聯繫思維方式的辯證統一是其發展的必然方向; 在非理性感性方面, 除了繼承機率和統計所包含的非理性感性因素, 還必須融入具有後現代主義色彩的一些因素諸如雜多性、模糊性、混亂性、非結構性、碎片性等。

[註1] 魏瑾瑞、蔣萍 (2014)。數據科學的統計學内涵。統計研究, 31, pp.3-9。


本文圖片轉載自: group.dailyview.tw/article/detail/682www.largitdata.com/blog_detail/20190725http://medium.com/....../%E8%B3%87%E6%96%99%E7%A7%91......

留言
avatar-img
留言分享你的想法!
JAD-avatar-img
2023/12/31
我認為大數據是很有用的工具,畢竟制定策略的時候,若是能納入更多正確有效的知識,是不是就能杜絕一些可以避開的錯誤呢?至少我個人覺得能善用的,都是好工具,不能善用的,就是試著學習如何善用他;如此感覺應該會過得更有前瞻性!
吳鐵肩-avatar-img
發文者
2024/01/10
JAD 同意
築夢人-avatar-img
2023/12/03
AI不會是神,也不會永遠是顯學,就有如元宇宙一樣,熱個幾年,大概又會被其他新話題所掩蓋掉了。但是,現在還沒有什麼科技上的新話題可以炒作,科技舞台就暫時由AI當紅了。當一切資源都耗費在AI上面,其餘問題很快就會顯現了。AI到底會不會發揮出那些枱面上的學者所說的樂觀效益?且讓我們拭目以待。
吳鐵肩-avatar-img
發文者
2024/01/10
築夢人 AI 是第四次工業革命的核心之一
彼得潘-avatar-img
2023/12/03
大數據應該是人工智慧的骨幹 統計學有其偏頗之處 其平均值不能涵括或代表全部的事實我對Ai和ChatGPT 等人工智能是鄙夷的 它沒有感情和靈魂 最多只能“仿冒”和“猜測” 它沒有人心的真誠。友人說我會被時代淘汰 可究竟要淘汰我什麼 也說不出個所以然來 我去中國自由行 沒有互聯網支付 人民幣還是能付帳的 搭飛機高鐵驗票雖人工但仍能通行 借一句古諺:帝力於我何有哉?
吳鐵肩-avatar-img
發文者
2024/01/10
彼得潘 Big data techniques is the basis of AI
avatar-img
吳鐵肩的沙龍
126會員
66內容數
吳鐵肩的沙龍的其他內容
2024/07/06
「善有善報、惡有惡報」是真的嗎?本文旨在回答這個問題-破除「善惡因果律 (或稱道德因果律)」的迷思,分析其心理、情感、信仰的基礎,並指出「德福一致」在社會實踐的幾個可能方向。
Thumbnail
2024/07/06
「善有善報、惡有惡報」是真的嗎?本文旨在回答這個問題-破除「善惡因果律 (或稱道德因果律)」的迷思,分析其心理、情感、信仰的基礎,並指出「德福一致」在社會實踐的幾個可能方向。
Thumbnail
2024/05/12
母愛對子女雖十分重要,但道德上並非真正偉大。本文目的是解構「偉大母愛」與「母親節」的信條-它們已被資本家、商家宣傳炒作而異化成為商品,鼓動了母親節消費狂熱與濫情氛圍。以下從親子相互意義、「偉大」必要條件、前衛女性對母愛的質疑、商家的炒作這四面向來論述 2024母親節來臨,兒女都在這一天替母親慶祝
Thumbnail
2024/05/12
母愛對子女雖十分重要,但道德上並非真正偉大。本文目的是解構「偉大母愛」與「母親節」的信條-它們已被資本家、商家宣傳炒作而異化成為商品,鼓動了母親節消費狂熱與濫情氛圍。以下從親子相互意義、「偉大」必要條件、前衛女性對母愛的質疑、商家的炒作這四面向來論述 2024母親節來臨,兒女都在這一天替母親慶祝
Thumbnail
2024/04/26
( 已刊載於 2024-04-21 01:16 聯合報/民意論壇) 中國崛起,要實現「中華民族偉大復興」,與美國爭雄,是本世紀全球最重大的事件;準總統賴清德宣誓上任後要做的「國家重建、社會改造、洗滌每一個人的人心」,則是近日台灣重大事件。從對立事件發生機率的起伏消長,或可一窺未來歷史發展的可能方向。
Thumbnail
2024/04/26
( 已刊載於 2024-04-21 01:16 聯合報/民意論壇) 中國崛起,要實現「中華民族偉大復興」,與美國爭雄,是本世紀全球最重大的事件;準總統賴清德宣誓上任後要做的「國家重建、社會改造、洗滌每一個人的人心」,則是近日台灣重大事件。從對立事件發生機率的起伏消長,或可一窺未來歷史發展的可能方向。
Thumbnail
看更多
你可能也想看
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
Q1. 大數據的特徵是什麼? Q2. 大數據思維的特徵是什麼? Q3. 世界的本質是數據和計算嗎? Q4. 科學研究最新 (第四) 範式 (paradigm) 是什麼? 本文回答以上四個問題。
Thumbnail
Q1. 大數據的特徵是什麼? Q2. 大數據思維的特徵是什麼? Q3. 世界的本質是數據和計算嗎? Q4. 科學研究最新 (第四) 範式 (paradigm) 是什麼? 本文回答以上四個問題。
Thumbnail
若你想一窺數據世界的全局及趨勢很適合閱讀此書,這篇文章也會和大家分享幾個有意思的觀點。大數據讓人們對於社會及商業模式有了全新的角度,但數據的複雜性也帶來更大的挑戰。
Thumbnail
若你想一窺數據世界的全局及趨勢很適合閱讀此書,這篇文章也會和大家分享幾個有意思的觀點。大數據讓人們對於社會及商業模式有了全新的角度,但數據的複雜性也帶來更大的挑戰。
Thumbnail
一、從大數據孕育出人工智能 (AI)。 二、宏觀角度-人異化成為數據及演算法之奴。 歐尼爾的警告:最安静的恐怖主義。 哈拉瑞的警告:數據主義和神人統治論。 三、微觀角度-人異化成為自己的陌生人、真實世界的陌生客。 網路大數據與 AI 是新型的精神舞台與精神鴉片。 網民變得稚萌淺薄,語言表達能力退化。
Thumbnail
一、從大數據孕育出人工智能 (AI)。 二、宏觀角度-人異化成為數據及演算法之奴。 歐尼爾的警告:最安静的恐怖主義。 哈拉瑞的警告:數據主義和神人統治論。 三、微觀角度-人異化成為自己的陌生人、真實世界的陌生客。 網路大數據與 AI 是新型的精神舞台與精神鴉片。 網民變得稚萌淺薄,語言表達能力退化。
Thumbnail
用數據藝術說故事,解構資訊時代的暗黑力量 我數據你;你數據我。他們數據我們;我們數據他們。 ~~我們全都數據在一起~~
Thumbnail
用數據藝術說故事,解構資訊時代的暗黑力量 我數據你;你數據我。他們數據我們;我們數據他們。 ~~我們全都數據在一起~~
Thumbnail
以前剖開表皮,見到橘子果肉就心滿意足。現在則是連纖維都不容錯過。
Thumbnail
以前剖開表皮,見到橘子果肉就心滿意足。現在則是連纖維都不容錯過。
Thumbnail
大數據時代來臨,身為數學腦殘的我一直都有種焦慮感,最近感觸更深,比如說前陣子在吵的新冠肺炎確診人數以及疫苗副作用,為什麼大家資訊理解程度如此不對等,其實一部分就是因為目前社會上會解讀數據的人相當少,不理解數據的人各自解讀、互相爭吵...
Thumbnail
大數據時代來臨,身為數學腦殘的我一直都有種焦慮感,最近感觸更深,比如說前陣子在吵的新冠肺炎確診人數以及疫苗副作用,為什麼大家資訊理解程度如此不對等,其實一部分就是因為目前社會上會解讀數據的人相當少,不理解數據的人各自解讀、互相爭吵...
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News