資料分析的3大目的:探索、解釋及預測

更新於 發佈於 閱讀時間約 2 分鐘

資料分析的三大目的,可分為探索性解釋性預測性的資料分析

探索性資料分析

目的在於了解業務流程和資料間的關係,以及資料本身不同變數之間的關係,主要由交叉分析拆解業務流程。例如:從資料中觀察到,某服飾店的年輕男性顧客較多,少部分為中年女性,這是資料本身呈現的狀態。

解釋性資料分析

是透過資料,了解業務流程上過去發生狀況的可能原因,從假設出發,逐步驗證假設是否為真,主要由統計分析或是社會科學的研究方法進行。例如:年輕男性較多,透過假設「是否因為廠牌特色符合時下年輕人喜好?」透過研究設計進一步發放問卷蒐集和分析資料可以得知他們選擇光臨主要是針對特定品牌,或是進一步發現,中年女性光顧是為了買給兒子等,為了現象解釋背後可能的原因。

預測性資料分析

對於未知的未來精準預測,透過定義預測的目標變數,例如:下個季度的銷售額等,建立預測模型並透過科學驗證方式評估結果,其中多屬於機器學習方法,若模型表現不錯,那麼對於未來就可以有模型預測的實用價值。

比較

三種資料分析的目的、主要使用方法和複雜度各有不同。探索性資料分析往往透過交叉分析,例如性別和年齡組別單獨(男性、女性;年輕、中年、年長)或是交叉(年輕男性、年輕女性、中年男性、中年女性、年長男性、年長女性),計算平均客單價,可以了解業務流程或是促銷活動中,和資料所呈現的結果的一致性,一般而言透過Excel中的樞紐分析表可以完成,複雜度低。

而驗證性資料分析可以透過統計方法,例如提出假設「年輕男性的平均客單價是否顯著高於平均」,則可以透過t檢定,驗證假設是否為真;需要較多的統計學知識,複雜度為中等。

預測性資料分析往往透過機器學習方法進行,例如在資料處理完成後,透過多個變數共同建立模型,目的是為了「預測下個季度的銷售額」,除了了解演算法本身的運作方式,需要處理的變數量往往也較多,通常也需要更熟練的程式技巧,複雜度相對高。

比較不同資料分析目的

比較不同資料分析目的

然而,三種資料分析目的之間並無明顯區隔,往往是交互運行、互為參考,例如:在對於對於資料間的關係並無先驗知識(prior knowledge)時,首先透過探索性資料分析,掌握資料欄位間的關係,挖掘可能的疑問;進一步針對疑問提出問題的假設,透過統計比較、解釋性演算法,了解可能的原因;接著可以對於這樣的問題,建立預測模型,對於未來發生事件的可能性提供預測結果,及時因應。

資料分析目的間的交互關係

資料分析目的間的交互關係

當然,如果開始的目標就是建立預測模型,在過程中進行特徵工程(feature engineering)時,同樣需要透過探索性資料分析得到洞見,過程中也會發現一些資料呈現的有趣現象和可能詮釋,進一步優化預測模型。

結論

資料分析的目的可以分為探索性、解釋性和預測性,有各自不同的是用情境和複雜度,但重點仍視需求決定分析的目的。

最後

此篇作為背景知識的補充,資訊量不多,若有需要也會隨時補充。有任何想法也歡迎留言給我,謝謝。


avatar-img
28會員
19內容數
和大家一起看見台灣的資料,包含人口、經濟、社會等相關議題。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
李政旺的沙龍 的其他內容
在資料科學中常可以聽到「權重」,可藉由專家經驗和機器學習取得「權重」,但他們差別是什麼?在透過演算法決定權重的想法相對盛行的現今,又如何整合兩種途徑的結果?
決定「分析單位」是資料分析執行前,最需要確認的項目;決定了「分析單位」等同於決定分析結果數據呈現方式、解讀和應用方法。讓我們一起了解「分析單位」到底是什麼?什麼會決定分析單位?以及沒有弄清楚分析單位會有什麼影響?
在資料科學中常可以聽到「權重」,可藉由專家經驗和機器學習取得「權重」,但他們差別是什麼?在透過演算法決定權重的想法相對盛行的現今,又如何整合兩種途徑的結果?
決定「分析單位」是資料分析執行前,最需要確認的項目;決定了「分析單位」等同於決定分析結果數據呈現方式、解讀和應用方法。讓我們一起了解「分析單位」到底是什麼?什麼會決定分析單位?以及沒有弄清楚分析單位會有什麼影響?
你可能也想看
Google News 追蹤
一、為什麼要做數據分析? 產品優化的參考依據 用戶的所有行為都會化為一個個數字在後台呈現,包含但不限於付費數據、關卡通關次數、角色養成狀況與道具使用狀況等數據,從茫茫數字資料中挖掘並匯整成有用的資訊,最終轉換成結論與解決方案。 提高溝通成功率 「我覺得A玩法很無聊」 跟 「根據數據顯示,A玩
2-1 取得統計資料 統計學,指的就是搜集、整理、表現及分析資料的方法。 一般來說,當我們想要知道對於某件事,大眾的普遍想法時,我們可能會透過調查的方式,得到想要的答案。也就是說,我們可能透過問卷或者是電訪的方式,直接收集所要的母體資料。舉個例子來說,在總統選舉時,當侯選人舉辦政見發表會後,為了
Thumbnail
透過簡單的舉例,分享從原始資料到洞察發現的完整過程,包括資料清洗、特徵工程、探索性資料分析,以及如何根據分析結果提出具體建議。
Thumbnail
本文介紹進行研究的三個主要角度:靈感驅動、數據驅動和文獻驅動。透過瞭解每種方法的具體作法及其各自的優缺點,研究者可以更好地選擇適合自己的研究方法。
Thumbnail
作為一名擁有多年經驗的數據分析師,我深知數據分析的重要性及其對企業決策的影響。然而,數據分析並不是在任何情況下都適用。今天我想跟你聊的事情是:在數據量不足或缺乏流程優化目的時,進行數據分析的局限性。
Thumbnail
這篇文章分享了作者在參與預估專案時的思考脈絡和學習點,透過兩個具體的案例,探討了預估方法中重要的假設和挑戰。
消費者研究,可以了解以下: 瞭解消費者行為、能力、態度,了解消費者本身有哪些限制 確認消費者使用情境、需求,以期產品最終符合消費者期許的目標 讓設計決策能有依據,並非猜測或個人喜好,可以回朔研究結果 確認專案目標,以利後續評估產品成敗   研究消費者基本特徵,運用顧客標籤進行分眾  常
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
有別於試圖直接從數據中找出洞察,商業分析的精髓在於先思考 so what——從定義目標開始,做出商業決策的雛形後,才用數據去支持假說。這篇文章介紹 A/B 測試的技巧,以及摘櫻桃的應用,解說數據篩選的操作、摘櫻桃的好處,以及企業案例:數位轉型後的報社,亞馬遜CEO貝佐斯改造百年郵報。
Thumbnail
我們常把研究分成量化與質性兩種不同的方法(當然不止這兩種方法),其中量化分析主要在討論變數與變數的關係,而質性分析則在變數間在的互動過程與事件。因此通常在進行質性研究時,我們需要收集大量田野調查或訪談資料。做過訪談的人都知道,訪談後需要反覆的聆聽訪談錄音並將其轉化為訪談逐字稿,這是一個大工程,還好現
一、為什麼要做數據分析? 產品優化的參考依據 用戶的所有行為都會化為一個個數字在後台呈現,包含但不限於付費數據、關卡通關次數、角色養成狀況與道具使用狀況等數據,從茫茫數字資料中挖掘並匯整成有用的資訊,最終轉換成結論與解決方案。 提高溝通成功率 「我覺得A玩法很無聊」 跟 「根據數據顯示,A玩
2-1 取得統計資料 統計學,指的就是搜集、整理、表現及分析資料的方法。 一般來說,當我們想要知道對於某件事,大眾的普遍想法時,我們可能會透過調查的方式,得到想要的答案。也就是說,我們可能透過問卷或者是電訪的方式,直接收集所要的母體資料。舉個例子來說,在總統選舉時,當侯選人舉辦政見發表會後,為了
Thumbnail
透過簡單的舉例,分享從原始資料到洞察發現的完整過程,包括資料清洗、特徵工程、探索性資料分析,以及如何根據分析結果提出具體建議。
Thumbnail
本文介紹進行研究的三個主要角度:靈感驅動、數據驅動和文獻驅動。透過瞭解每種方法的具體作法及其各自的優缺點,研究者可以更好地選擇適合自己的研究方法。
Thumbnail
作為一名擁有多年經驗的數據分析師,我深知數據分析的重要性及其對企業決策的影響。然而,數據分析並不是在任何情況下都適用。今天我想跟你聊的事情是:在數據量不足或缺乏流程優化目的時,進行數據分析的局限性。
Thumbnail
這篇文章分享了作者在參與預估專案時的思考脈絡和學習點,透過兩個具體的案例,探討了預估方法中重要的假設和挑戰。
消費者研究,可以了解以下: 瞭解消費者行為、能力、態度,了解消費者本身有哪些限制 確認消費者使用情境、需求,以期產品最終符合消費者期許的目標 讓設計決策能有依據,並非猜測或個人喜好,可以回朔研究結果 確認專案目標,以利後續評估產品成敗   研究消費者基本特徵,運用顧客標籤進行分眾  常
Thumbnail
選舉民調是預測選舉結果的重要工具。然而,如果我們不了解樣本和母體的概念,就很容易被民調結果誤導。 在本文中,我們將介紹樣本和母體的概念,以及它們對民調結果的影響。我們還將提供一些在閱讀民調報告時的注意事項。
Thumbnail
有別於試圖直接從數據中找出洞察,商業分析的精髓在於先思考 so what——從定義目標開始,做出商業決策的雛形後,才用數據去支持假說。這篇文章介紹 A/B 測試的技巧,以及摘櫻桃的應用,解說數據篩選的操作、摘櫻桃的好處,以及企業案例:數位轉型後的報社,亞馬遜CEO貝佐斯改造百年郵報。
Thumbnail
我們常把研究分成量化與質性兩種不同的方法(當然不止這兩種方法),其中量化分析主要在討論變數與變數的關係,而質性分析則在變數間在的互動過程與事件。因此通常在進行質性研究時,我們需要收集大量田野調查或訪談資料。做過訪談的人都知道,訪談後需要反覆的聆聽訪談錄音並將其轉化為訪談逐字稿,這是一個大工程,還好現