資料分析的3大目的:探索、解釋及預測

更新於 發佈於 閱讀時間約 2 分鐘

資料分析的三大目的,可分為探索性解釋性預測性的資料分析

探索性資料分析

目的在於了解業務流程和資料間的關係,以及資料本身不同變數之間的關係,主要由交叉分析拆解業務流程。例如:從資料中觀察到,某服飾店的年輕男性顧客較多,少部分為中年女性,這是資料本身呈現的狀態。

解釋性資料分析

是透過資料,了解業務流程上過去發生狀況的可能原因,從假設出發,逐步驗證假設是否為真,主要由統計分析或是社會科學的研究方法進行。例如:年輕男性較多,透過假設「是否因為廠牌特色符合時下年輕人喜好?」透過研究設計進一步發放問卷蒐集和分析資料可以得知他們選擇光臨主要是針對特定品牌,或是進一步發現,中年女性光顧是為了買給兒子等,為了現象解釋背後可能的原因。

預測性資料分析

對於未知的未來精準預測,透過定義預測的目標變數,例如:下個季度的銷售額等,建立預測模型並透過科學驗證方式評估結果,其中多屬於機器學習方法,若模型表現不錯,那麼對於未來就可以有模型預測的實用價值。

比較

三種資料分析的目的、主要使用方法和複雜度各有不同。探索性資料分析往往透過交叉分析,例如性別和年齡組別單獨(男性、女性;年輕、中年、年長)或是交叉(年輕男性、年輕女性、中年男性、中年女性、年長男性、年長女性),計算平均客單價,可以了解業務流程或是促銷活動中,和資料所呈現的結果的一致性,一般而言透過Excel中的樞紐分析表可以完成,複雜度低。

而驗證性資料分析可以透過統計方法,例如提出假設「年輕男性的平均客單價是否顯著高於平均」,則可以透過t檢定,驗證假設是否為真;需要較多的統計學知識,複雜度為中等。

預測性資料分析往往透過機器學習方法進行,例如在資料處理完成後,透過多個變數共同建立模型,目的是為了「預測下個季度的銷售額」,除了了解演算法本身的運作方式,需要處理的變數量往往也較多,通常也需要更熟練的程式技巧,複雜度相對高。

比較不同資料分析目的

比較不同資料分析目的

然而,三種資料分析目的之間並無明顯區隔,往往是交互運行、互為參考,例如:在對於對於資料間的關係並無先驗知識(prior knowledge)時,首先透過探索性資料分析,掌握資料欄位間的關係,挖掘可能的疑問;進一步針對疑問提出問題的假設,透過統計比較、解釋性演算法,了解可能的原因;接著可以對於這樣的問題,建立預測模型,對於未來發生事件的可能性提供預測結果,及時因應。

資料分析目的間的交互關係

資料分析目的間的交互關係

當然,如果開始的目標就是建立預測模型,在過程中進行特徵工程(feature engineering)時,同樣需要透過探索性資料分析得到洞見,過程中也會發現一些資料呈現的有趣現象和可能詮釋,進一步優化預測模型。

結論

資料分析的目的可以分為探索性、解釋性和預測性,有各自不同的是用情境和複雜度,但重點仍視需求決定分析的目的。

最後

此篇作為背景知識的補充,資訊量不多,若有需要也會隨時補充。有任何想法也歡迎留言給我,謝謝。


留言
avatar-img
留言分享你的想法!
avatar-img
李政旺的沙龍
29會員
19內容數
和大家一起看見台灣的資料,包含人口、經濟、社會等相關議題。
李政旺的沙龍的其他內容
2023/07/23
模型上線前的評估的嚴謹與否,攸關上線後模型的表現。你知道模型評估需要注意哪些細節?在評估過程的嚴謹性又可以如何分級呢?一起來看看吧!
Thumbnail
2023/07/23
模型上線前的評估的嚴謹與否,攸關上線後模型的表現。你知道模型評估需要注意哪些細節?在評估過程的嚴謹性又可以如何分級呢?一起來看看吧!
Thumbnail
2023/07/22
資料分析就像廚師料理一樣,但你知道可以分成哪9大流程嗎?一起看看資料分析流程和廚師料理有多像!
Thumbnail
2023/07/22
資料分析就像廚師料理一樣,但你知道可以分成哪9大流程嗎?一起看看資料分析流程和廚師料理有多像!
Thumbnail
2023/07/02
在資料科學中常可以聽到「權重」,可藉由專家經驗和機器學習取得「權重」,但他們差別是什麼?在透過演算法決定權重的想法相對盛行的現今,又如何整合兩種途徑的結果?
Thumbnail
2023/07/02
在資料科學中常可以聽到「權重」,可藉由專家經驗和機器學習取得「權重」,但他們差別是什麼?在透過演算法決定權重的想法相對盛行的現今,又如何整合兩種途徑的結果?
Thumbnail
看更多
你可能也想看
Thumbnail
家中修繕或裝潢想要找各種小零件時,直接上網採買可以省去不少煩惱~看看Sylvia這回為了工地買了些什麼吧~
Thumbnail
家中修繕或裝潢想要找各種小零件時,直接上網採買可以省去不少煩惱~看看Sylvia這回為了工地買了些什麼吧~
Thumbnail
👜簡單生活,從整理包包開始!我的三款愛用包+隨身小物清單開箱,一起來看看我每天都帶些什麼吧🌿✨
Thumbnail
👜簡單生活,從整理包包開始!我的三款愛用包+隨身小物清單開箱,一起來看看我每天都帶些什麼吧🌿✨
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
智能分析通常分為描述性(descriptive)、預測性(predictive)和指示性(prescriptive)三種類型。《哈佛商業評論》於2023年5月刊登了一篇名為〈行銷分析〉(Analytics for Marketers)的文章,探討了企業評估機器學習介入分析的適宜程度,以及如何選擇最適
Thumbnail
智能分析通常分為描述性(descriptive)、預測性(predictive)和指示性(prescriptive)三種類型。《哈佛商業評論》於2023年5月刊登了一篇名為〈行銷分析〉(Analytics for Marketers)的文章,探討了企業評估機器學習介入分析的適宜程度,以及如何選擇最適
Thumbnail
研究者應該要依據研究題目與「當下的自己」作為考量,選擇適合的研究方法。當然研究方法可以不只用一種,所以都試試看也沒什麼不好。但我想強調的是,每個人的生命經驗、個性、專長、人脈,都可能影響到使用各種研究方法的適合度和效果。 這篇主要分享文本分析、論述分析、訪談、參與式觀察四種質性研究方法。
Thumbnail
研究者應該要依據研究題目與「當下的自己」作為考量,選擇適合的研究方法。當然研究方法可以不只用一種,所以都試試看也沒什麼不好。但我想強調的是,每個人的生命經驗、個性、專長、人脈,都可能影響到使用各種研究方法的適合度和效果。 這篇主要分享文本分析、論述分析、訪談、參與式觀察四種質性研究方法。
Thumbnail
資料分析三個主要的目的分別是探索性、解釋性及預測性。看看他們在方法及複雜度上有什麼差異,以及適用的情境。
Thumbnail
資料分析三個主要的目的分別是探索性、解釋性及預測性。看看他們在方法及複雜度上有什麼差異,以及適用的情境。
Thumbnail
  在跑統計前的二三事─量化研究常見迷思 當中提到了一些量化研究的常見迷思,這篇想要簡單提一下跟統計有關的方法學子領域。   為什麼要提這個呢?因為有時候看起來像是統計的問題,其實在統計學裡面不一定能找到答案。如果不知道這類型的問題屬於哪個領域,就會連怎麼找資料都做不到。
Thumbnail
  在跑統計前的二三事─量化研究常見迷思 當中提到了一些量化研究的常見迷思,這篇想要簡單提一下跟統計有關的方法學子領域。   為什麼要提這個呢?因為有時候看起來像是統計的問題,其實在統計學裡面不一定能找到答案。如果不知道這類型的問題屬於哪個領域,就會連怎麼找資料都做不到。
Thumbnail
市場調查(Market Research)又稱市場研究,專注於對目標市場與消費者的瞭解,像是消費者的需求、偏好等等,透過對市場與消費者的深度瞭解,行銷人員將能夠更有效地進行行銷企劃。
Thumbnail
市場調查(Market Research)又稱市場研究,專注於對目標市場與消費者的瞭解,像是消費者的需求、偏好等等,透過對市場與消費者的深度瞭解,行銷人員將能夠更有效地進行行銷企劃。
Thumbnail
透過機器學習與統計分析角度分析UCI機器學習資料集中的網路顧客購買意圖資料,並透過決策樹方式預測顧客是否會購買產品,提及少部分特徵選取、資料不平衡問題。
Thumbnail
透過機器學習與統計分析角度分析UCI機器學習資料集中的網路顧客購買意圖資料,並透過決策樹方式預測顧客是否會購買產品,提及少部分特徵選取、資料不平衡問題。
Thumbnail
從踏入職場以來,我的工作就跟大量的數據一直沾上邊,從台灣銀行業的數據,亞馬遜工廠的數據,到Flixbus的行銷數據,從營運,行銷到銷售的數據分析,小到「一天我管的團隊包裝了幾個包裹」,大到「一年高達上億的行銷預算分析」都有碰過,我一直在思索,到底需要怎麼樣的技能才能把這個工作做好?
Thumbnail
從踏入職場以來,我的工作就跟大量的數據一直沾上邊,從台灣銀行業的數據,亞馬遜工廠的數據,到Flixbus的行銷數據,從營運,行銷到銷售的數據分析,小到「一天我管的團隊包裝了幾個包裹」,大到「一年高達上億的行銷預算分析」都有碰過,我一直在思索,到底需要怎麼樣的技能才能把這個工作做好?
Thumbnail
在這篇文章中,我會簡要分享關於數據思維,以及從零到一,建立數據思維、分析與應用的參考書單。有不足與建議之處,也歡迎提出討論!
Thumbnail
在這篇文章中,我會簡要分享關於數據思維,以及從零到一,建立數據思維、分析與應用的參考書單。有不足與建議之處,也歡迎提出討論!
Thumbnail
歡迎來到大哥的研究方法講座。這個講次會介紹研究的意義與重要性。放輕鬆,不會出現一堆專有名詞,更不會用繁雜的數學式嚇人。 所謂的研究(Research),其實只是針對任何東西進行比較深入的探討,不論是人、事、時、地、物皆可。表1隨意舉例。 表 1 這個簡單的範例也顯示出,研究目的很可能是「解決問題」
Thumbnail
歡迎來到大哥的研究方法講座。這個講次會介紹研究的意義與重要性。放輕鬆,不會出現一堆專有名詞,更不會用繁雜的數學式嚇人。 所謂的研究(Research),其實只是針對任何東西進行比較深入的探討,不論是人、事、時、地、物皆可。表1隨意舉例。 表 1 這個簡單的範例也顯示出,研究目的很可能是「解決問題」
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News