GA4引入DDA作為默認歸因?且慢!

Photo of author
Written By CMO

當地時間10月5日,谷歌GA團隊發布聲明,將對GA4作進一步的更新。對於本次更新各媒體的看法是谷歌暗示UA退出歷史舞台的速度將加快。因為字面的意思是“我們鼓勵您使用新的Google Analytics 作為您未來的主要網絡和應用程序分析解決方案。”那麼這次更新究竟包含了啥?

Google Analytics 4又更新了
Google Analytics 4又更新了

GA4即將新增與GSC的數據對接

在現有的GA4中,我們並不能看到與Google Search Console的對接。在ADMIN-PRODUCT LINKING之下,我們僅能看到Google Ads Linking,Ad Manager Linking,BigQuery Linking三個選項。不久以後,我們便可以像原來在GA3(使用analytics.js/gtag.js的Universal Analytics)中那樣與GSC數據對接了。

“Search Console提供有關您網站的自然搜索性能的詳細訊息,包括網站在搜索結果中的排名、帶來點擊的查詢以及點擊後數據(如參與會話和轉化)。通過新的Search Console 集成,您將能夠了解自然搜索相對於其他行銷渠道(例如搜索廣告、電子郵件或社交)在增加網站流量和參與度方面所起的作用。”

羅素凱徹姆Google Analytics 產品管理總監

如果真的能像上面描述的那樣,這實在是一種進步。因為在GA4以前,雖然我們可以看到GA中導入的GSC數據,但是對於某些檢索詞的表現、它們最終轉化如何,我們並不清楚。

GA4將啟用DDA作為默認歸因模型

谷歌引入Data-Driven-Attribution已經有6個年頭,從Google Ads到GA360,DDA已經成為搜索行銷人員熟知的歸因模型。HubSpot One在2017年曾經介紹過這種以沙普利值作為算法的歸因模型。雖然其合理性不如馬爾科夫鏈模型,但是由於方便計算且比傳統模型更科學的優點還是值得使用。

接下來的更新中GA4就將繼Google Ads之後採用DDA進行默認的歸因和匯報。並且,與Google Ads中一樣,谷歌不再需要最少學習數據就可以為你用DDA計算新的轉化分配

使用以數據為依據的歸因(DDA)按渠道分組進行的轉化
使用以數據為依據的歸因(DDA)按渠道分組進行的轉化

這種“先上車后買票”的做法讓人匪夷所思。可以預料到的是谷歌會先用一種粗放的模型來套用,在數據不斷積累之後再慢慢修正初始的誤差。

DDA還可以被應用到之前HubSpot One介紹過的兩個新報表Model comparison和Conversion paths中。看似高級,可是問題出在Default channel grouping上。我們知道在以往的版本中用戶是可以自定義Channel Grouping的,我們如果發現某個谷歌沒有正確歸類的訪問來源,我們是可以自定義將它們歸為某種來源的。為了解決這個問題,HubSpot One曾經專門寫過用Data Studio來克服的教程。畢竟我們如果連渠道歸類都搞不清楚那麼再高級的歸因還有什麼意義呢?

在此,假設我們依舊可以通過Data Studio或者BigQuery來重新歸類訪問來源,但是之後又有誰來為我們用DDA重算各渠道類別的轉化數呢?這點,我們不得而知。我們只知道,GA4的默認渠道分類相當簡單粗暴:

Channel Definition
Direct Source exactly matches direct
AND
Medium exactly matches (not set)
OR
Medium exactly matches (none)
Organic Search Medium exactly matches organic
Paid Social Source matches matches regex ^(internal list of social sites)$
AND
Medium matches regex ^(cpc|ppc|paid)$
Organic Social Source matches matches regex ^(internal list of social sites)$
OR
Medium matches regex ^(social|social-network|social-media|sm|social network|social media)
Email Medium = email|e-mail|e_mail|e mail
OR
Source = email|e-mail|e_mail|e mail
Affiliates Medium = affiliate|affiliates
Referral Medium = referral
Paid Search (GA Medium matches regex ^(cpc|ppc|paidsearch)$
AND
GA Ad Network does not exactly match DISPLAY)
OR
GA Ad Network exactly matches PAID_SEARCH
Video GA Ad Network exactly matches VIDEO
Display GA Ad Network exactly matches DISPLAY
Default Channel Grouping規則

HubSpot One只能建議讀者依舊從Last (Paid) Interaction出發來看數據了。先不要急著用GA4告訴你的數據來做決策。

“模糊”化的分析數據

“建模”的“模”和“模糊”的“模”是一個漢字真是體現了中華智慧。如果要問谷歌是如何應對“第一次互聯網隱私危機”的,那或許答案便是“建模”。谷歌的“建模”如同FLoC,很大程度上是和“模糊”化分不開的。

The future is based on first-party data.
The future is consented.
And the future is modeled.

Vidhya Srinivasan,谷歌廣告購買、分析和衡量副總裁

既然未來是基於建模數據的,那真實數據就只能掌握在少數人手中。只是但凡你記得去年年底HubSpot One的那篇《再談GA數據的不一致,罪魁禍首竟是它! 》你就能懂得“差之毫釐,謬以千里”的道理。

谷歌對數據進行建模處理的“官方說法”是將那些“無人認領”的轉化按照模型分配到各個渠道中,這些轉化可能是因為隱私保護或者用戶不接受Cookie無法跟踪到。但是這裡將會產生一個極端嚴重的反信任危機。因為你怎麼證明你沒有把更多的轉化算在Google Ads(或者其他G系廣告)頭上?你的機器學習和其成果始終會是一個黑盒子,GA4的用戶如何才能知道並相信被套用的結果是公平公正有據可依的呢?

當裁判使用一種並不透明的算法來分配時
當裁判使用一種並不透明的算法來分配時

對於建模和轉化歸因,如果你想了解更多,可以參考Ken Williams的文章《How conversions are modeled in Google Analytics 4》

以上我們介紹了GA4正在發生的變化和筆者的個人看法。我們正在經歷一個超強數據能力與超嚴格數據保護的兩股力量碰撞的時代,如何能比競爭對手多看到一些真實的數據並產生更正確的洞察會是未來五年乃至十年勝負的關鍵。