認識 Google Analytics的『取樣數據』- 初學者篇
圖片來源:unsplash.com、Harris先生提供
甚麼樣的狀況Google Analytics可能會使用取樣數據?
當資料太龐大、或你提出客製化的資料需求時(比方說進階區隔或是次要維度),Google Analytics會先檢視這些資料條件是否需要取樣,如果Google Analytics判定需要,它會為了加快給你數據報表的時間,採用取樣數據,這些特定狀況如下:
● 在指定日期範圍中,資源層級的工作階段量超過 500,000個。
● 你在預設的報表內使用了客製化的進階區隔、或次要維度。
● 在自訂報表內的篩選器使用了客製化的篩選條件。
● 在多管道程序報表中,你所選取的指定日期範圍中,超過一百萬個轉換。
● 在行為流程報表中,你所選取的指定日期範圍中,超過十萬個工作階段。
如何解決Google Analytics的取樣數據問題?
取樣數據並不能完整地被解決,這是Google Analytics的缺陷之一,但你可以用以下的方式來稍微改善取樣數據的問題:
1.調整取樣數據的設定
在報表的右上方,如果你看到數據並不是來自於100%,你可以選擇“精準度更高"來降低取樣的狀況,假設你原先設定為“回應速度更快",並且取樣為1%的工作階段,在你更改為精準度更高之後,Google Analytics會根據你的需求,花上更多時間運算,並把取樣的比例調高到4%。基本上取樣的比例越高,數據會越精準,若沒有趕時間的話,我建議你都選取“精準度更高"來給Google Analytics多一點時間運算、並觀察取樣比例較高的數據資料。
2. 縮短觀察的時間比例
有時候取樣數據會發生在你所選取的時間範圍太長,假設你一次選取了一整年的數據資料來觀察,因資料過於龐大,Google Analytics為了加快運算,會用取樣數據,我建議你不妨把觀察的時間範圍縮短,來減少資料量、並取得更精準的數據。
3. 盡量使用預設報表
如果你的需求都能被預設報表滿足的話,你可以盡量只使用預設報表來減少數據取樣的發生狀況。
無論如何,在使用Google Analytics時,你一定要注意取樣的問題,尤其如果部門在計算KPI、ROI、各個流量管道成效時,取樣更有可能傷害到你的指標計算,如果你的網站流量很大,更會提高數據取樣的機率,因此你一定要注意。
(本文刊載於Harris先生,未經授權,不得轉載。)<本專欄反映專家意見,不代表本社立場>
