GA到GA4: 掌握網站數據分析新工具的技術原理與商業思維
書籍資訊
- 書名:GA到GA4: 掌握網站數據分析新工具的技術原理與商業思維
- 作者: 張秉祖
- 出版社:深智數位
- 出版日期:2021/09/16
為何要導入GA4?
首先,作者一開始介紹了GA4在應用面上的最大特點,就是可進行跨平台運作,只要我們使用了GA4,就能夠同時收集、分析來自網站和行動應用程式(APP)的訪客資訊,徹底顛覆了過去使用不同工具,導致資訊有缺口的不便,也正因為如此,GA4的優勢就是具備了追蹤同一位訪客進行跨平台的足跡整合,執行以「人」為核心的行為分析全貌。
GA4的報表分析架構
GA4將左邊sidebar以「生命週期Life cycle」的概念進行劃分,整個核心框架,主要依循交易購買漏斗所經過的各階段所建立的。
- 客戶開發 Acquisition
- 參與 Engagement
- 營利 Monetization
- 回訪率 Retention
「流量開發」報表深入解讀
以內容來看,【流量開發】報表和原本通用版的【來源/媒介】報表有些雷同,差別在於其中的指標取捨與定義,透過三大層次來進行分類:首先,就是流量的多與少;其次,看流量的品質(好/壞);最後,挖掘出流量對企業帶來的實際目標轉換與營收貢獻。
辨識訪客的方法
長久以來,GA都是使用第一方Cookie(CID)來辨識訪客,這就稱為「揮發性的匿名歸戶」。CID在GA4中的說明文件,屬於裝置ID(Device ID)。如果針對APP,GA4則會存取裝置的廣告ID,Android稱作(AAID),iOS稱作(IDFA)。
「揮發性」代表這一支cookie並非穩定長駐,用戶端可以封鎖,也可以隨時清除它;「匿名」則是隨機給予的亂數值,其中並沒有附帶任何與訪客真實身分的相關訊息。
到了GA4中,因為跨平台歸戶的重要性,對於辨識訪客的要求就更高了,所以整合了User ID、Google Signal、Device ID三個層次技術的訪客辨識機制,讓訪客的歸戶,更為精準有效。
互動工作階段
GA4對於「互動工作階段」這個新名詞,給予了全新的技術定義:
- 瀏覽停留時間合計超過10秒(無論瀏覽一頁或多頁)
- 瀏覽超過一頁
- 觸動轉換事件
以上只要滿足三者中的一項,這次到訪就被計為「互動工作階段」。
而這又會延伸到另一個GA4的獨特指標「參與度」(互動工作階段數 / 總工作階段數),此指標會說算是用來取代以前通用版的「跳出率」,為何說算是?其實參與度想說的故事和跳出率完全一樣,也是要辨識出流量的效度,只是方向從「無效流量」變成反向的「有效流量」觀察,目的都是透過指標判別,可進而強化優質流量,檢討劣質流量,以避免資源浪費。
值得注意的是,雖然兩者的觀察目的是一致的,可是卻不能說互為補數,「參與度」不等於1減去「跳出率」。為了解釋這差異,作者使用一個統計分析的術語做解釋。
2020年起,由於新冠疫情肆虐,快篩或普篩都會提到偽陰(False Negative)、偽陽(False Positive),其中的陰與陽、正或負的標籤,其實沒有好與壞之分,而是以分析關注項為「陽」,反之則為「陰」。所以,當我們用「跳出」來做解釋流量效度時,關注項就是「跳出」,「跳出」就被解釋為「陽」,「非跳出」為「陰」;若把觀點放在「參與」這個面相時,就變成「參與」為「陽」,「非參與」為「陰」。
因此,由於「跳出」的定義為「沒有任何互動就離開」,用來評斷無效流量的標準(臨界值,或稱「閾值」)算是蠻嚴苛的,所以解釋成信賴度高,同樣的考量點,判斷為非跳出的流量,是不是真的為「有效流量」,就沒有太大把握,用數據語言來說就是「偽陰性」偏高;相反的,「參與」的三個條件用來判斷參與的標準,就顯得過於寬鬆,所以反而是「偽陽性」偏高。
總的來說,GA4以使用「參與度」來分辨流量是否有效的時候,對於高參與度的工作階段,不能就等同視為有效流量,需要透過其他的條件與區隔,加以驗證才可以。
「使用者開發」報表深入解讀
「使用者開發」報表的指標欄,與「流量開發」報表大致相同,比較容易混淆的則是「使用者開發」報表在來源、媒介、廣告活動...等維度上,於前綴詞加上了「使用者」,而非「工作階段」。以GA4的官方文件來看,「使用者來源」的定義是「Source by which the user was first acquired」,明確一點的闡述,此份報表只包含了「在報表時段範圍內,初次造訪的訪客」的所有行為紀錄,也就是說如果有一位訪客,在報表時段內初次來訪,則他在報表時段內所有的行為,都會被納入,其他「使用者媒介」、「使用者廣告活動」,也是同樣的概念。
「參與」報表深入解讀
「參與」報表的主體,看起來平淡無奇,但是在Overview中,卻隱含了一個彩蛋功能「User stickiness」(使用者黏著度),黏著度分析主要是以短週期活躍使用者除以長期週期活躍度使用者,黏著度的好與壞沒有絕對的標準,但一般APP會以DAU/MAU=10%當作一個警示界線,如果黏著度低於此值,或是持續往下降,就有很大的可能是用戶對於產品已經慢慢失去熱情了😢!
GA4「事件」的重要性
事件—就是紀錄訪客互動的資料形式
在以前的通用版GA中,是沒有預設事件的,必須透過額外的安裝代碼,才能追蹤到瀏覽頁面之外的動作。但GA4完全改變了這觀點,它回到了最底層的技術邏輯,將整個訪客的互動行為,包含「網頁瀏覽」,都當作「事件」來處理,好處是邏輯統一且充滿彈性,但壞處就是可憐了負責操作GA蒐集數據的我們,自主執行的各種設定大幅增加,墊高了進入障礙,學習曲線明顯的被拉長(快等於了以前打掉重練😂)。
關於轉換事件
GA4已將大家習慣的「目標」功能移除,取而代之的是,全面開放用戶的選擇自由,針對所有事件,可以自行決定是否為【轉換事件Conversion】,我認為其實也只是換個方式,把「轉換」定義為「目標設定」。
而在開始設定「轉換」之前,有幾件事情需特別注意:
- 唯一強制設為轉換的是建議事件中的purchase,無法變更。
- 在報表中出現的指標欄「總收益」,只加總了purchase事件中,記錄交易金額的value參數值。
- 在通用版GA中,事件的「互動」與「目標」,是兩個不同層級的概念,設定也是獨立的,前者會影響「跳出率」,後者則是影響「轉換」,但是GA4只使用轉換一種設定,既會影響「目標達成」,也會影響「參與度」,所以在設定事件時,考量的範圍就要更廣。
GA4的數據流程—凡事皆事件
本書一再強調事件對於GA4的重要性,在GA4的世界裡,一切的訪客互動,都是先以「事件」收錄到數據模型中,而「事件」的結構設計是透過「名稱/參數」的組合,所以一個事件名稱可以附掛多個參數,這些數據可讓使用者當成後續應用的「原料」特徵標籤。
可是當我們想要以這些收集到的參數值,進行更深層的分析時,這樣的準備工作是仍不夠的,而為了要在報表中進行維度與指標上的變數搭配,還需要開啟「自訂維度」與「自訂指標」的功能,基本上,所有文字型的參數,都可以用來自訂維度;而數值型的參數,則可以用來自訂指標,有了這些設定,才能夠以變數欄位的形式出現在報表中。
以我們「樂屋網」為例,為了記錄網站上使用者的重要點擊行為,就設定了一個代碼事件【Button_click】,並將幾個我們所需的參數值附掛在事件的後面。
下一步,在GA4資源的報表區左側功能選單選擇Configure->Custom definition,然後點選右上方Create custom dimensions的功能按鍵,開啟新增自訂維度畫面,輸入完成後儲存即可,接下來重複進行同樣的設定,就能建立所有需要的自訂維度。
GA4目前開放兩種範圍的自訂維度,除了前述「事件層級」的自訂維度外,還有「使用者層級」的自訂維度,它的內容對應是附掛在人身上,而不是事件行為上,例如,最常見的記錄使用者ID(User ID),就是一個典型的「使用者屬性」。
一樣以「樂屋網」做個簡單的示例,我們用GA4設定的基本Tracking code來進行,將User ID變數納入「使用者屬性」中。
GA4的探索自訂報表
異常偵測功能
在任意型式的報表視覺化呈現中,Line chart有一項少見的以機器學習建構的「異常偵測」功能,在標籤設定欄下,只要開啟Anomaly Detection功能開關,就可以根據趨勢,選擇用來訓練機器學習的數據日期範圍,調整想要的敏感度,系統就會自動在右邊Line chart上,以圓圈標註出異常資料點,如下圖所示:
路徑探索Path Exploration與通用版GA流程圖的不同
新版GA4的路徑探索報表新增了動態檢視與回溯的功能,以及可從「起點」與「終點」進行雙向的開展,算是完全顛覆了我們之前使用通用版GA的習慣,其中「路徑探索」的基本結構,就是把訪客的足跡,以「步驟」與「節點」兩維展開。
橫向為步驟,可以選擇「網頁」與「事件」,縱向則可以看到從「網頁」與「事件」細分出來的各個資料點,稱之為「節點」,目前此報表的缺點是數值僅可選擇「活躍使用者」、「事件計數」、「總人數」,尚無法新增其它指標。
若選擇Start over重新開始,以「終點」做為路徑探索的第一步,這樣的思考脈絡就雷同於通用版中的目標回溯,先設定目標行為,再往回一步一步推算展開,反向探索用戶達成目標的足跡行為。
使用者多層檢視User Explorer
另外特別介紹「使用者多層檢視」報表,直接從範本中開啟「User Explorer」報表,其中的主要維度鎖死為App-instance ID以及Stream name,也就是所謂的「裝置ID」與「資料串流」,目前是不能自行變換的。
由於裝置ID是匿名資訊,並以用戶為單位,資料數量通常很大,沒有使用數據方法預處理,是看不太出來甚麼東西,所以我們就會透過計算基本統計數據,進行所謂的「描述分析」。接著,若還要想更深入了解某一位用戶的行為,只要點擊選定的ID,就會展開「User activity」畫面視窗,顯示這一個用戶的個人詳細記錄。
如果我們在這一位用戶的行為紀錄中,找到了某些重要的行為特徵,GA4還附贈一個殺手功能,就是把這些行為動作勾選起來,然後建立「區隔」,就可以直接將這些互動當作條件,完成區隔設定。
回顧分析流程
回顧整個GA的報表結構脈絡,隱含了分析的重點與目的,就是希望能夠和可執行的商業策略進行連結,首先,我們透過描述性分析,找出基本的分類構想,然後再透過多維度的交叉分析,挖掘出更多的蛛絲馬跡,最後,再針對每個相同或相異的特徵樣本,以區隔打包分組,並據以規劃出針對性的商業對策。
以上整個流程,都是透過GA4的強大數據分析功能,具體挑出有意義的訪客足跡,然後進行區隔分群,後續無論是輔助進階分析、或是規劃再行銷、推薦等精準Martech行銷作為,可以達到事半功倍。
GA4的電子商務關鍵分析
在電子商務分析上,GA4跟通用版GA有個很大的不同,就是已經取消了「增強型電子商務功能」模組,取代的是只要依官方建議的事件規範設定原則,替交易階段的訪客互動,設定事件與參數,就可以架構出追蹤電子商務的環境。
GA4還特別地另外將電子商務的重點放在商品「行銷力」與「產品力」上,由報表呈現就可以看出端倪,在「Monetization->Ecommerce purchases」上方的兩張分析圖中,左方折線圖,顯示前五大產品頁瀏覽量的時序變化;右方散佈圖的X軸與Y軸數值,則分別以「個別產品頁瀏覽量」和「個別產品放進購物車次數」兩個指標所構成,這樣的方式共可歸納出三個重點:
- 以個別產品的粒度(Granularity)來做呈現,可以幫助我們執行產品優化方案時,具有更強大的著力點。
- 產品詳細資料的瀏覽次數,檢驗著我們所執行的全面性行銷活動(品牌定位、促銷活動、網站導流...等)是否有效,因為假若個別產品的產品頁被看到的次數偏低,自然很難期待後續會有轉換行為產生,所以「個別產品頁瀏覽量」,也能被解讀為評估個別產品的行銷力綜合指標。
- 而產品頁被瀏覽後,有沒有被「放進購物車」就是下一個挑戰,而這一個動作行為可以解釋不論頁面體驗設計、文案、產品介紹、定價策略、call to action...等都會影響到,所以「個別產品放進購物車次數」就能解讀為評估個別產品的產品力綜合指標。
即使以上介紹的個別產品「行銷力」與「產品力」都順利優化後,並不代表後續的目標轉換就會完成,後續還會有一些關鍵指標需要留意與觀測,例如「購物車放棄率」,只是這些都屬於後期指標,我們容易發現到,而GA4特別把前期的關鍵因子凸顯出來,就是因為前期的關鍵問題,顯性不足反而會忽略,如果一開始都沒有順利解決,就很難期待後期會有轉換效果產生了!
定義數據的價值
在此段文章中,作者有提到一個重要的觀念,數據的價值是奠基在我們進行搜集工作時,去附加了多少有意義的資訊相關,以及數據的結構是否嚴謹、定義清楚,與缺漏值多不多等面向,其中一個重要的加值效果,就是「加貼特徵標籤」。
以超商來舉例說明,假如我們到超商買東西結帳時,店員通常在掃描完商品後,會在結帳前,另外按下一個鍵,來記錄客戶的客層,比如說「性別」與「年齡層」選項,由店員以目視判斷後,記錄下來。
所以依樣畫葫蘆的,我們在電商平台購買商品時,只要購買結帳就觸發事件,與此同時,我們把購買品項、類別、數量、金額...等數據資訊,一併記錄下來,就是一種「加貼特徵標籤」,除此之外,我們還可以預想可能有價值的其它資訊,一併打包,以參數的方式附掛到「結帳」事件行為的後面,這時未來有任何商業策略的考量,因為有準備了這些廣大「食材」,才能炒出一道道的「好菜」。
數據加值的作業本身,有兩個明顯特徵,第一是難以回溯;第二則是數據的價值在於積累,所以早做早有,晚做晚有,沒做就沒有,因此,導入的最佳時機點是何時,答案和真相只有一個,別想了,就是「今天」😄😄😄。
GA4的深入分析Insights
最後面,就來介紹一下GA非常引以為傲的機器學習輔助決策系統「Insights」,開啟與設定的方式可以參考
官方介紹,這邊就不再贅述。
GA4的「Insights」功能,是希望藉由Google龐大的運算資源,以人工智慧的模式,看到許多我們以前單憑肉眼很難看出來之處,可先決條件仍是,即早使用GA4,讓系統去蒐集足夠多的歷史數據,才能發揮機器學習的最大功用,
所以不厭煩的一再提醒,早用GA4早享受(Google官方已公布2023年7月1日標準通用 Analytics 分析資源將停止處理新的命中資料),因為在未來的戰場上,打人海戰已經不是聰明的方式,怎麼透過外部工具的配合,發揮1+1大於10的加乘效果,才有可能是最為關鍵的致勝因素。