以Instagram討論,進行數據分析該注意的幾件事情
社群媒體做數據分析的三個關鍵字:
趨勢、極值、比較
這三個關鍵字是我執行時會一直在嘴巴碎念的原則,以下透過年末受到Engaged AI撰文的邀請分享一些個人心得。
大數據和小數據,差別在哪裡?
我們不見得每次都能夠經營大品牌的社群、網站,多半時候我們可能是在經營一個小型,甚至是微型的社群,每次報表出來的數據多則近百筆,少則可能只有幾十筆,這樣的數據也會有分析的價值嗎?
我的答案是,會。雖然分析的母體相對小,能夠延伸的範圍有限。
也因為這樣的狀況,其實早已有人提出過相對於大數據(Big Data)的概念— 小數據(Small Data)。
馬汀‧林斯壯(Martin Lindstorm)提出
「小數據(Small Data)」概念,敏銳觀察個別消費者的生活,追蹤細微線索,看穿潛在欲望,彌補了大數據的不足。
在一書中的前言提到
在這個迷戀大數據的時代,企業紛紛投入資料庫的建立。然而,大數據縱使提供了寶貴見解,卻也有一定限制:對於促使顧客消費的深層動機──「人的內在感受」,它幾乎一無所悉。
簡單來說,大數據是透過各種行為數據,找出數據及行為之間的相關性,小數據能告訴你因果關係;大數據擅長的交易路線是點擊、挑選和執行,小數據訴求「情感DNA」,是人性對話工具。
在分析之前,要知道哪些事情?
在做任何數據分析之前,有幾件重要的事情要知道:
清理、整理原始數據:一般的原始數據中,可能會有錯誤或誤植,例如:日期錯誤、數據亂碼、重複資料等。
目前,Instagram上能使用的數據很有限,也暫時還沒辦法像Facebook直接導出數據報表,因此在這部份就可以簡單帶過。
瞭解各平台的指標:看定義真的蠻無聊的,但非常重要,因為每個指標的定義方式會直接決定彼此的關係,也會作為往後分析的重要思維。
既然這次是在Instagram上,那就一定要先瞭解Instagram數據指標的各項定義,以下用Engaged AI幫大家整理的指標定義做參考:
舉個大家都容易理解的例子,
一篇好的貼文,理想的數據應該是「觸及」和「互動」都是高的,因此這兩個指標互相存在著「正向」的關係。當今天發出一篇貼文,在不投廣告的狀況下,有高觸及率但低互動率時,就會需要花時間去看裡面出了什麼樣的問題。
做完這兩件事情後,這些概念能夠直接延伸到各大平台,只要概念和邏輯是對的。
做小數據分析時,我會注意什麼事?
「極值、趨勢、比較」是我的口訣
說實話,這個口訣源自於我在考IELTs時的寫作考試,因為第一個部分都會有各種統計圖表要描述,為了能夠在有限時間內寫出文章來,我都會照著這個邏輯去思考。
極值:舉凡表格中的最大、最小值及異常值。異常值像是一個持續平緩的圖表中,突然有增加或減少的情況,就會吸引我第一個去觀察該點發生的狀況。
趨勢:整個數據呈現出的趨勢為何,是上升、下降或是平緩?
比較:單一數據能夠給的資訊有限,甚至是無效,但當不同的數據擺在一起比較,就會出現意義。
舉例來說,有一篇貼文呈現著高互動但低觸及,對於這篇貼文可能的猜測會是:
(1)潛力貼文:在群體內受歡迎,但因為觸及率的因素或經營前期階段,而無法廣傳。
解決方法:可能會是 投廣告、將資訊散布到相關社團、辦理分享活動等。
(2)數據錯誤:單一數據軟體得到的數據多半有所差異,但當差異過大就必須要仰賴第三方或其他數據去驗證哪個才是正確的。
學會統計和商業模型,有助於分析更精準 既然是分析,那多半脫離不了統計,這裡指得也不是很艱深的那種,而是我們以前都有學過的統計,以下簡單列舉幾個常用的: (1)平均數 (2)中位數 (3)眾數 (4)加權平均數 (5)迴歸分析 原因是當你瞭解這些統計指標,你就會知道每個指標能夠用來解釋的極限,像是平均數會受到極值的影響。因為這個限制,在分析時先將極值扣掉再做一次平均數得到的數據,能夠更為客觀。 另外,找到幾個慣用的商業模型可以在分析時找到更多切入點,以波士頓矩陣(BCG矩陣)為例: 圖片來源:經理人 BCG矩陣實際上是一個二乘二的矩陣,橫軸是相對市場佔有率(以公司業務的市場佔有率除以同業最高的市場佔有率而獲得),縱軸是市場預期增長,再加上兩軸各自的分界而成 BCG矩陣的橫軸和縱軸可以根據指標的不同自由替換,在每個區間內的貼文,你可以套用各區塊的定義去判斷結果。 如果再BCG矩陣結合迴歸分析,除了能夠判斷數據是否正確之外,也可以找出一個簡易的預測模型判斷每一篇貼文平均的數據。 以上的內容快速地分享我如何做小數據的分析,分析除了數字之外,也還是需要搭配該領域的知識,才能夠做出合理的商業解釋和數據判斷。我也相信每個人的方式都不太一樣,只要能夠找到合理的結果及解釋,並輔以數據證明其實都是行得通的。 最後,歡迎有興趣的人可以提供數據,一起討論、分析可能的方向,如有商業合作,請來信至yxchen030@gmail.com