而在这个过程中,总的来说需要 三个步骤:
1、发现异常流量特征
2、将异常流量“提纯”
3、分析异常流量的成因
第一步我们要找到异常流量,为了提升这个工作的效率,我总结了一套清单,希望能作为大家的工作手册使用。我先列出清单中的项目,后文再详细解释:
1、分小时对比异常和正常的两天,分别对比UV/会话/PV等指标
2、如果有其他流量统计系统,互相验证数据准确性
如果个别小时流量变动明显:
3、确定异常时间段,去找技术部同事排查问题(如果可能,先在域名报告、所有页面、内容分组报告里聚焦到出问题的某部分页面,方法见后)
4、去找运维部同事查询,异常时段内的http请求数是否也异常(如果是,说明流量实际上确实变了;如果否,可能是统计代码本身出问题,实际流量并没变化)
5、去找产品/运营的同事询问是否有产品改版,或是组织了什么在线活动
6、如果异常是均匀分布在各小时中,就要去查各个维度上,是否存在异常突出的项目,那可能就是出问题的点:
- 流量来源
- 新/老用户
- 着陆页
- 所有页面(组)
- 事件
- 省份/城市
- 浏览器/操作系统
- 手机品牌/型号(移动端访客)
- 上网运营商
1、断崖式:下跌时段如此明显,接下来我们可以直接到域名或所有页面报告中,很容易的定位到下跌的页面,然后去找技术和运维的同事排查问题即可。
2、个别小时小幅度异常
与明显的断崖式下跌相比,如果只是个别小时疑似下跌,是不太容易定位到下跌的域名/页面的,因为缺失的流量被全天的数据“稀释”了。但是还好,GA有强大的高级细分功能,我们可以单独看下跌的那个小时的数据。这个过程就是本文开头提到的“将异常流量提纯”:
经过高级细分之后再去看域名报告,我们就能很明显的定位下跌的部分了:
发现异常域名后进一步,在次级维度中调出着陆页,就能更精准的找到出问题的页面:
在其他流量统计系统中可能也会有类似的细分功能,总之思路是相通的,就是找到有异常的维度,然后用它做细分条件,提取出问题最集中的那部分流量。
3、全天候均匀下跌
有时候出问题的维度不是小时,例如下面这个例子:
我们发现so.com来源的流量明显下降了,但是在小时维度数据上是比较均匀分布的:
于是这次我们不在小时上做细分,而是建立一个“so.com来源”的细分,完成异常流量的“提纯”工作,接下来就要分析异常的成因了。这个过程其实也简单,只要带着“提纯”用的高级细分,到各个报告中去寻找其他维度的异常即可。
结果是,我们在“浏览器”报告中发现只有Vivo系统浏览器数据变动很大,然后我们继续用次级维度细分该浏览器带来的流量来源,结果发现随着so.com来源的降低,百度的流量基本在同等增加,那么原因就比较明显了,非常可能是这个浏览器将搜索框里原本导给so.com的那些流量切到了百度。
三、分析系统之外还有什么工作
前文中的方法能够应对大部分流量异常的情况了,但如果异常数据在任何维度都是平均分布的,找不到异常点怎么办?这时候可以先打开网站/App看一下,有时候问题就摆在那里很容易发现。
另外还可以考虑一下外部因素,例如学生开学可能导致游戏相关流量下降,周末如果赶上大范围的重雾霾天气可能导致娱乐类流量上升(用户们都宅在家了),我们甚至还遇到过《焦点访谈》的一个镜头中出现了我们的品牌,导致来访流量大涨。寻找这些外部因素没有一定之规,能否找到也要看一点运气了。
本文为@运营喵原创,运营喵专栏作者。