【数据系列1】数据埋点与用户行为分析

date
Oct 31, 2024
slug
用户行为采集
status
Published
tags
数据
产品
summary
数据埋点与用户行为分析的整体方法论
type
Post
本文也发布在人人都是产品经理:https://www.woshipm.com/operate/6138975.html

前言

用户行为分析是指对用户的一系列行为进行分析,以改善产品设计和运营策略。随着互联网从粗放到精细化的发展,用户行为分析可以帮助产品设计和运营策略制定也从“凭感觉”转向“科学化、定量化”。
简单来说,如果把互联网C端产品比作一个大游乐园,产品经理与前后端研发分别是这个游乐园的建筑设计师和工程师,打造这个游乐园的基本框架。运营是游乐园的活动策划,在游乐园内不定期举办各种各样的活动。而用户行为分析可以对游客的行为进行定量分析,以改善游乐园的建筑设计和活动质量。

数据流水线:采集-加工-分析

从工程的角度来看,想要对用户行为进行分析,需要经过以下步骤:
  1. 采集用户行为数据(埋点+数据存储)
  1. 清洗和加工这些数据
  1. 对数据进行分析
notion image
在一家大型互联网公司,数据往往像是流水线上的商品,从生产到加工到最终被利用,会经历层层步骤,并最终输送向不同的应用部门。这使得数据链路上的不同角色容易只见树木、不见森林。我希望能从用户行为分析的视角,回归数据的本来的目的,梳理这条数据流水线是如何帮助建造互联网游乐园的。

数据分析:指标、维度、口径

从数据生产的角度,先有埋点才能进行数据分析,最终得到结论。但实际往往需要以终为始:先思考数据分析的最终目的,再确定数据分析的思路,最终确定埋点方案。
用户行为分析的基本思路是:确定衡量产品成功与否的量化指标 -> 思考哪些维度会影响指标的变化 -> 确定统一的口径,计算出不同维度下不同指标的变化。
以下,是对指标、维度、口径更进一步地解释。

指标

指标是一种可量化的业务目标。对电商来说,终极指标是GMV;对广告来说,终极指标是转化率、ROI;对游戏来说,终极指标是DAU、ARPU值。
为达成最终的指标,还可以细拆为多个过程指标。比如对电商来说,用户支付前的链路可以拆解为:进入app->搜索(推荐/直播等等)->进入商品详情页->加入购物车->结算->支付。每个环节都可以设定一个指标。

维度

维度是分析指标变化的一种视角,也可以理解为是影响指标变化的一种因素。
怎么理解呢?如果DAU变高了,是男用户上涨得更多,还是女用户?用户性别就是影响DAU的因素,也是可以用来分析DAU变化的一种维度。同理,商品的价格、品类,也是用来分析GMV的维度。

口径

口径是指标计算的一种标准。
在互联网,同一个指标往往有多种计算方式。比如,计算DAU,可以用用户设备号去重得到,也可以用用户唯一的账号去重得到,每一种计算方式(或标准)就是一种口径。

数据采集:事件、时机、参数

在数据分析的目标明确的基础上,我们需要考虑如何获取需要的数据,来满足分析的目标。
从上文已经可以知道,数据分析的思路是先确定指标,再考虑维度,最终统一口径。而数据指标需要通过记录对应的用户行为事件统计得到,分析维度需要我们在记录事件的同时也记录下和这个事件相关的参数,统一口径中重要的一部分是在记录事件时明确规范这个事件发生的时机
以下,是对事件、时机、参数更进一步地解释。

事件

用户的每一个行为被称为一个事件。一般来说,互联网上用户的行为主要分为三大类:
  1. 浏览:用户进入产品的某个页面
  1. 曝光:产品页面上某个元素/信息被展示在用户面前
  1. 点击:用户主动点击了页面上的可交互元素
在埋点时,每一种事件都会有一个独立的id(通常被称为事件id)——比如点击首页焦点图(Home_FirstFocus_Click)。

时机

时机是每个行为被记录的准确时刻。正如计算指标时需要口径一样,时机也是对埋点事件更精准的定义,是埋点的一种口径。
  1. 浏览时机:进入某个页面接口返回前/接口返回后
  1. 曝光时机:某个元素露出xx%、用户停留xx秒时
  1. 点击时机:用户点击后立刻触发

参数

有了对事件与时机的定义,就需要明确在这个事件发生时需要采集哪些具体的信息。
采集用户的行为就像是在写记叙文,需要记录下:人物、时间、地点、具体事件。除了事件id外,其他需要被记录的信息被抽象为这个事件的参数。事件的参数类似执行某个事件的情境、条件。有人将埋点需要记录的信息抽象为4W1H:
  1. Who:用户是谁——即用户id、设备号等
  1. When:在什么时间——发生这件事的具体时间
  1. Where: 在什么地点——有两层理解,一是用户的实际IP地址,二是发生这个事件的页面
  1. What:做了什么事——即事件的类型(浏览、曝光、点击等)
  1. How:如何做这件事——即做这件事时的业务属性,比如点击商品时商品的价格、折扣信息
对于每一种事件(如点击首页焦点图),不同的人、在不同的时间、不同的情景下会做出这个行为,每一个被记录下的具体行为被称为一条日志。如此,用户的每一个行为都被详细地记录。

一个具体的case:电商数据分析与埋点的思路

有了上述的概念,理解数据埋点与用户行为分析还是有些抽象。下面从一个典型的电商case出发,理解如何一步步对电商用户行为进行分析。

Step1. 思考用户旅程

一个用户通过联盟广告进入某个电商app后可能会有以下用户旅程:
点击联盟广告 -> 进入app -> 商品卡片曝光 -> 点击商品卡片 -> 进入商品详情页 -> 点击加入购物车 -> 点击结算 -> 进入结算页面 -> 点击支付 -> 进入支付完成页面

Step2. 确定核心指标与重要维度

电商产品是否成功最核心的指标是最终的GMV,但达成GMV的目标需要用户经过一系列的用户旅程,最终为某个商品支付。因此,我们可以针对用户旅程中的每一步设立过程指标。
GMV = 支付PV * 客单价
支付PV = 曝光PV * 曝光点击率(PV) * 点击加购率 (PV) * 加购结算率(PV) * 结算支付率(PV)
曝光点击率(PV) = 点击PV/曝光PV
...
依次细拆以后,我们就可以得到所有的非复合指标,这些指标也对应着需要采集的事件。
除此之外,电商往往会从人、货、场的角度对指标进行多维度分析,这也对应着每个事件需要采集的参数。
notion image

Step3. 埋点设计

根据需要计算的指标与分析的维度,定义需要进行埋点的事件与参数,并确定上报时机的规范。
notion image

Step4. 数据回收与分析

理解了用户旅程,确定了核心指标与分析思路,埋点设计并回收到数据后,最终开始进行数据分析。
在这个环节,我们依据刚刚确定好的思路,利用已经采集到的数据进行计算,并对计算得到的结果进行分析。
  1. 先计算最终的数据指标GMV,得到GMV是上升还是下降
  1. 观察这个最终结果,是由哪些中间指标引起的
  1. 思考影响这些中间指标的主要维度是什么,通过分析得到哪些维度引起了指标的变化
  1. 最终得到相对科学的结论
在数据分析环节,还有很多需要注意的细节,在此不再赘述,仅仅介绍进行数据埋点与分析的整体思路。

总结

所谓数据导向,其实是围绕一种以终为始的思考方式,确立最终目标并将大的目标拆分为过程指标和不同维度,用量化的数据来将不确定的变化变得更加确定化。
除此之外,尽管每类产品都会有一个终极的北极星指标(比如电商的GMV),但如果要建立一个健康完整的生态,我们需要搭建一个好的指标体系,多方面地衡量一件事的好坏。比如对于电商来说,商家的供给数量、用户画像、用户停留时长等等,都是完整刻画一个平台健康程度的指标。
对于个人来说也是一样,我们的终极目标是什么,达成这个目标需要经过哪些过程,除了终极目标以外,我们还有哪些不同的目标来让人生更加精彩,这些都是值得深思的问题。当然,人生有更多的灵活性,就像某一类产品的用户路径也有可能因为一次成功的创新彻底被颠覆。跳脱出既有的数据框架去思考产品,才有可能创造更大的可能性。
 

© Lara Dong 2021 - 2025