大数据系列 -- 用户流失率计算

有同学问:用户流失该怎么分析?用户流失率的数据可以算,可算出来以后呢?只看数据似乎完全看不出什么流失原因,只知道用户已经X个月没有来了,也不知道看到这个能干啥。今天系统解答一下。

 

用户流失分析常见错误

 

☆错误1试图挽留每一位用户。这是运营最常见的错误,很多新人都会踩这个坑。不购物了就发券,不登录了摇转盘。结果空烧经费,养出来一帮无利不起早的羊毛客。实际上,用户流失是不可避免的,天下没有100%的留存。每种业务都要关注自己的核心用户。在谈及用户流失的时候,我们真正要做的是:把流失率关在笼子里,控制在一个可以接受的水平上。

 

错误2试图搞懂每一个流失原因。这是分析最常见的错误,很多新人都会踩这个坑。用户不喜欢?我们没做好?对手太厉害?用户没钱了?——总之想给每个人一个理由。可压根没数据,于是大眼瞪小眼。实际上,我们没必要、也没能力穷举所有原因。同上一条,我们只要控制可控因素,减少明显错误即可。

 

☆错误3只盯流失不看活跃,事后诸葛。这是另一个常见错误。在流失率实际增高以后才开始分析。结果木已成舟,用户都跑了,分析了也没啥用。流失率是个相对滞后的指标。在数据上“流失”以前,用户可能已经跑掉了,早前几个月就没活跃了。所以,流失率要和活跃率结合起来看。对于影响用户活跃的事件要尽早关注,对于核心用户活跃率要紧密跟踪,避免事后做无用功。

 

用户流失分析基本思路

 

用户流失分析的目标是把流失率关在笼子里,因此在数据上,我们首先关注的是流失率走势,尤其关注三类问题(如下图所示)。

 

1、事件型问题。由一次/多次事件引发的短期流失率波动。

2、系统型问题。公司整体流失率高于同行/经验水平,并且居高不下。

3、持续型问题。流失率从某时间开始持续增高,未见好转迹象。

 

流失率是一个和活跃率相对的概念。虽然我们习惯上会给一个:用户X月不登录/不购货即为流失用户的定义,但当用户已经不活跃的时候,真实的流失可能已经发生了。为了更好的发现流失问题,往往自然周期和生命周期两种方式,结合活跃率一起看。自然周期往往指向事件型问题(因为事件是按自然日期发生的),生命周期往往指向系统型问题(业务做得不好,用户生命周期短or存在断点)。

 

事件型问题分析方法

 

负面的事件会引发用户流失。比如缺货、涨价、系统BUG、用户投诉、对手大促销(我们还恰好没做)等等。这一类事件最容易被识别到。体现在数据上,受事件影响的用户群体活跃率,会在事件发生后应声而落,之后N个月,流失率开始增长。

 

在分析时,需要

1、收集并密切注意相关事件。

2、做好事件归类(内部/外部、系统/价格/商品…)。

3、锁定受影响用户群体(打好标签备观察)。

4、关注受影响用户活跃变化。

5、观察事件对整体流失影响。

 

这样就事论事,更容易看出结果。在设计挽留方法时,也更容易对症下药。找到真正让用户不爽的原因,比单纯的塞优惠券更能保留用户。

 

需注意:正面事件也会提升流失率。特别是用户拉新、促活、留存、唤醒等等。单纯的刺激非消费类软指标,最容易引发虚假繁荣。客观上:只要有优惠活动,就会吸引套利的羊毛客,这类用户天生流失率就高。主观上讲:运营方为了制造好看的数据,也会减少限制,留下套利空间。两下作用,使得正面活动的效果往往会打折。比如新用户注册,由拉新活动产生的用户生命周期流失率很容易明显高于正常新用户的(如下图),之后N个月,这一批用户流失率势必高。

 

因此,在做活动的时候,就得提前考虑相关后果。正面事件不同于负面,该做还得做,我们全面评估它就好了。虽然最后的结果,可能是策划、运营不想面对的,这里实际考察的是大家的节操值。

 

系统型问题分析方法

 

如果发生系统型问题,只说明一点:我们的业务做得比对手差。此时,诊断业务问题,改善业务表现才是核心。诊断方法,可以参照用户生命周期理论。

用户在进入期、成长期、成熟期的流失原因有所不同,分析的侧重点也有不同,为了节省篇幅,这里简单总结如下图。有兴趣的同学可以在文末点个在看,数量超过20个再看我们专门分享噢。

 

在应对系统型问题时,不同阶段考虑的重点不同。一般在进入期,会无差别改善。在进入期,用户实际上还没有体验到我们提供的核心卖点,因此需要无差别改善流程,让用户尽可能体验到核心卖点再说。在互联网行业往往关注黑色一分钟(下载到注册的一分钟)关注新手教程的过程。在传统行业,往往强调迎客话术,尽快让用户做一次体验,试用一下产品。

 

进入成长期后,需要分类对待。进入成长期后,边缘用户、羊毛用户会被淘汰,用户价值也开始分化。非核心用户,就该让他流失掉,一味挽留只是空浪费经费,还会因为打折频繁让品牌贬值。这时要特别关注的是核心用户的流失,核心用户的活跃率下降,生命周期缩短,新进用户中核心用户占比下降,都是大问题,需要细致梳理和解决。有可能没有等到流失率真的涨上来,就已经开始行动了。

 

系统型问题可能不是一步解决的,而是持续迭代的过程。有可能我们能诊断出问题,但解决方案并不好使唤,并不能改善数据。因此如果发现存在系统型问题,需要:

 

1、选好参照标杆,找准差距

2、设计解决方案,投入测试

3、记录测试结果,观察数据变化

4、积累经验,保留有效方法

 

最终,我们看到的是我们的用户留存曲线越来越接近竞争对手,流失率持续下降,这时候可以说:系统型流失问题已得到解决。这中间可能要很多次试验、尝试,因此需要做好观察和记录,打持久战。

 

持续型问题分析方法

 

持续型问题往往最难解决。因为实际上流失率、活跃率、留存率等数据,经常出现不规则小幅度波动,而不是大幅度持续增长。这就是真正的鸡肋问题:放着不管、领导总问。想管一管,没有头绪。甚至还有流失率涨了几天,分析报告还没写出来丫就跌回来了,真是尴尬。

 

处理的顺序,事件型》系统型》持续型。因为单次的重大事件最容易被识别到,容易通过数据看清楚。同时,往往一系列事件是导致系统型、持续型问题的根源,能识别具体事件对处理其他问题也有帮助。系统型问题,在业务方经验丰富的情况下,能找到合适的标杆,因此相对容易处理。

 

最难的事持续型问题,往往流失率变化不会持续到特别严重,而是小范围反复波动(如下图),在缺少经验、数据积累的情况下,很难完全识别这些小波动,所以最后解决。如果真解决不了,就设立观察指标,先追踪起来。等到有一定程度,可能可以找到线索。 

 

不同业务类型流失处理差异

 

因为流失问题和业务高度相关,因此不同业务流失分析方向也不同。从大类上看,有两个最重要的区分维度。

 

贵重低频产品VS便宜的快消品。越贵的产品(车、房、大件家居、婚庆……),用户决策流程越长,越倾向于事前判断,不存在复购一说。此类业务用户决策有明显的窗口期,越往deadline接近,用户最后下判断可能越大。所以,此类业务用户流失是个倒计时沙漏,在接触到用户的第一时间要搞清楚用户状态:用户需求是什么、对比了哪些竞品、是否已经开始议价,这样可以大概判断:留给我们的时间还有多少。从而更好抓住成交机会,赶紧跟进。而不是傻傻不分需求,按部就班介绍、跟进,黄花菜都凉了。

 

快消品,或者购买频次高的消费类产品(比如衣服、鞋、手机)用户天生忠诚度低,很容易被流行趋势、促销活动改变态度。完全可以采用无差距挽留的策略。反正用户这一次不买,过一段时间也会回来买。因此处理此类产品,互联网企业往往区分平台流失与产品流失两个流失留存。只要用户还停留在平台上,就持续做唤醒。传统企业往往利用换季、新品上市、周期庆、节日活动等手段,多频次激活用户。总之,只要用户价值足够大,就不抛弃、不放弃。

 

☆传统行业VS互联网行业。两者在用户生命周期上积累的数据量不一样。互联网行业数据较多,往往可以记录用户从点击推广链接-落地页-注册-浏览-下单全过程,因此常采用漏斗分析法,看流失用户会卡在哪些步骤,锁定问题点做改进。特别是新人注册阶段,往往是无差别优化。

 

传统行业往往只有消费数据,因此只能用消费频次、消费间隔来衡量用户。一般用户在消费n次以后,不喜欢的会流失,喜欢的会持续买,这就是所谓的魔法数字。通过魔法数字的大小对比,可以知道自己与对手的差距。至于用户到店-迎客-体验-服务-评价等行为层面,完全没有数据,需要通过市场调查等手段补齐。

 

这里主要是提醒,业务间差异很大,虽然流失的定义可以定成XX月不登录/不购买。但是实际流失场景可能早就发生了,制止流失的关键动作也有可能没有数据记录。多结合具体业务思考办法,比机械码数字管用。 

 

小结

 

很多同学觉得用户流失问题很难处理。从明面上看,是因为用户流失的数据少,我们不知道用户心理怎么想的。可从本质上看,是因为会导致用户流失的原因,与用户生命周期、用户分群、用户决策流程、用户成长路径、新用户转化流程、用户体验、用户MOT、竞品影响等众多因素有关。这里随便一个主题拿出来都能单独摆一篇文章。整明白了这些,基本就搞懂了整个用户运营的流程。本质上,用户流失分析难,难在:做分析的同学们很少懂用户运营的业务。

 

拉一个做分析的同学出来问:

  • 生命周期该是多长?

  • 行业性留存率是多少?

  • 核心用户是什么群体?

  • 核心卖点是什么体验?

  • 竞争对手有多大差异?

  • 最近运营发生了啥事?

  • 出现哪些意外bug?

  • 最新改动有什么影响?

  • ……

 

回答都是:不太知道。甚至是:统统不知道。你问他知道啥?他只知道计算个流失率的数据,然后按用户年龄、性别、注册渠道、购买频次……等指标做一大堆交叉表。然后对着一组组数据1%、2%、3%的差异发呆:到底说明什么了呢?

 

以上是个玩笑。总之分析不仅仅是跑个数据拉个表,更是深入问题内部、找到业务上真正病根。

已标记关键词 清除标记
一、课程简介<br /> <br /> 随着技术的飞速发展,经过多年的数据积累,各互联网公司已保存了海量的原始数据和各种业务数据,所以数据仓库技术是各大公司目前都需要着重发展投入的技术领域。数据仓库是面向分析的集成化数据环境,为企业所有决策制定过程,提供系统数据支持的战略集合。通过对数据仓库中数据的分析,可以帮助企业改进业务流程、控制成本、提高产品质量等。<br /> <br /> 二、课程内容<br /> <br /> 本次精心打造的数仓项目的课程,从项目架构的搭建,到数据采集模块的设计、数仓架构的设计、实战需求实现、即席查询的实现,我们针对国内目前广泛使用的Apache原生框架和CDH版本框架进行了分别介绍,Apache原生框架介绍中涉及到的技术框架包括Flume、Kafka、Sqoop、MySql、HDFS、Hive、Tez、Spark、Presto、Druid等,CDH版本框架讲解包括CM的安装部署、Hadoop、Zookeeper、Hive、Flume、Kafka、Oozie、Impala、HUE、Kudu、Spark的安装配置,透彻了解不同版本框架的区别联系,将大数据全生态系统前沿技术一网打尽。在过程中对大数据生态体系进行了系统的讲解,对实际企业数仓项目中可能涉及到的技术点都进行了深入的讲解和探讨。同时穿插了大量数仓基础理论知识,让你在掌握实战经验的同时能够打下坚实的理论基础。<br /> <br /> <br /> 三、课程目标<br /> <br /> 本课程以国内电商巨头实际业务应用场景为依托,对电商数仓的常见实战指标以及难点实战指标进行了详尽讲解,具体指标包括:每日、周、月活跃设备明细,留存用户比例,沉默用户、回流用户、流失用户统计,最近连续3周活跃用户统计,最近7天内连续3天活跃用户统计,GMV成交总额分析,转化率及漏斗分析,品牌复购率分析、订单表拉链表的设计等,让学生拥有更直观全面的实战经验。通过对本课程的学习,对数仓项目可以建立起清晰明确的概念,系统全面的掌握各项数仓项目技术,轻松应对各种数仓难题。<br /> <br /> 四、课程亮点<br /> 本课程结合国内多家企业实际项目经验,特别加入了项目架构模块,从集群规模的确定到框架版本选型以及服务器选型,手把手教你从零开始搭建大数据集群。并且总结大量项目实战中会遇到的问题,针对各个技术框架,均有调优实战经验,具体包括:常用Linux运维命令、Hadoop集群调优、Flume组件选型及性能优化、Kafka集群规模确认及关键参数调优。通过这部分学习,助学生迅速成长,获取前沿技术经验,从容解决实战问题。<br /> <br /> <br /> <div> <br /> </div>
相关推荐
©️2020 CSDN 皮肤主题: 酷酷鲨 设计师:CSDN官方博客 返回首页