架构 13 周
1.电商常用的数据分析指标有哪些
1.1 基础数据
营销数据:包括营销费用、覆盖用户数、到达用户数、打开或点击用户数,由此衍生出人均费用、营销到达率、打开率等指标。
流量数据:包括浏览量(PV)、访客数(UV)、登陆时间、在线时长等数据。
会员数据:包括会员姓名、出生日期、真实性别、网络性别(根据购物行为判断所得)、地址、手机号、微博号、微信号等基础数据,以及登陆记录、交易记录等行为数据。
交易及服务数据:包括交易金额、交易数量、交易人数、交易商品、交易场所、交易时间、供应链服务等数据。
行业数据:做电商,了解行业数据非常必要,如淘宝的数据魔方提供行业品牌的关键词搜索、店铺排名、销售、会员等数据查询
1.2 流量指标
浏览量(访问量),即 PV(Page View),指用户访问页面的总数,用户每访问一个网页就算一个访问量,同一页面刷新一次也算一个访问。
访客数,即 UV(Unique Vistor),独立访客,一台电脑为一个独立访问人数。一般以天为单来统计 24 小时内的 UV 总数,一天之内重复访问只算一次。当然,现在一些平台支持自选时间段(1 小时、一天、一周)为去重标准。访客又分为新访客和回访客。
当前在线人数,指 15 分钟内在线的 UV 数。
平均在线时长,指平均每个 UV 访问网页停留的时间长度。(补充,如果网站是为了帮助客户尽快完成他们的任务(比如:购买,答疑解惑),那么在线时长应当是越短越好;如果希望客户一同参与到网站的互动中来,那么时间越久会越好。所以,分析在线时长是否越长越好,要根据产品定位来具体分析。)
停留时间:指用户打开网站最后一页时间点减去第一个页面的时间点,所以该指标不能完全等同于用户浏览时长。为什么会存在这样的情况,主要是由于目前技术限制而采用这样的近似替代关系。
平均访问量(平均访问深度):指用户每次浏览的页面数品平均值,即平均每个 UV 访问了多少个 PV。
日均流量,有时候会用到日均 UV 和日均 PV 的概念,即平均每天的流量。
跳出率,指只访问了一个页面就离开的访问次数除以该页面所有访问次数。分为首页跳出率、关键页面跳出率、具体产品页跳出率等。这些指标用来反应页面内容受欢迎的程度,跳出率越大,页面内容一般越需要调整。
1.3 转化指标
转化率:指进行了相关动作的访问量占总访问量的比率。转化率是电商运营的核心指标,也是用来判断营销效果的指标。
注册转化率:即注册用户数除以新访客总数,当我们的目标是积累会员总数时,这个指标就很重要了。
客服转化率:咨询客服人员的用户数除以总访问数,这个类似于线下的试穿率。
收藏转化率:即将产品添加收藏或者关注的用户数除以该产品的总访问数。每逢双十一等大型促销钱,用户都会大量收藏产品到自己账户以便促销时购买。
添加转化率:即将产品添加到购物车的用户用户数除以该产品的总访问数,这个指标主要针对具体产品。
成交转化率:即成交用户数除以总访问数,一般我们提到的转化率就是成交转化率。成交转化率还可以细分为全网转化率、类目转化率、品牌转化率、单品转化率、渠道转化率、事件转化率等。
渠道转化率:从某渠道来的成交用户数除以该渠道来的总用户数,这个指标用来判断渠道质量。
事件转化率:因某事件带来的成交用户数除以改事件带来的总用户数,有些事件可以跟踪到人,例如营销中的关键字投放,其他网站的广告投放等。
1.4 营运指标
成交指标:成交金额、成交数量、成交用户数。
订单指标:订单金额、订单数量、订单用户数、有效订单、无效订单。
退货指标:退货金额、退货数量、退货用户数、金额退货率、数量退货率、订单退货率。
效率指标:客单价、件单价、连带率(销售的件数 / 交易的次数)、动销率(有销量的商品数 / 在售商品数)。
采购指标:采购金额、采购数量。
库存指标:库存金额、库存数量、库存天数、库存周转率、售罄率。
供应链指标:送货金额、送货数量、订单满足率、订单响应时长、平均送货时间。
1.5 会员指标
注册会员数:指曾经注册过的会员总数,其没有太大意义,所以可以用有效会员数概念,即在 1 年内有消费记录的会员数。
活跃会员数:指在一定时间内有消费或者登陆行为的会员数,时间周期和产品购买频率有关,快消品一般会在周期上定义短些。
活跃会员比率:即活跃会员占会员总数的比重。
会员复购率:指在一段时间内产生二次及以上购买行为的会员数占总会员数的比率。
平均购买次数:指某时期内每个会员平均购买的次数,订单总数除以购买用户数,最小值为 1.
会员回购率:指上一期活跃会员在下一期有购买行为的会员比率,回购率和流失率是相对概念。
会员留存率:某时间节点的会员在某特定时间周期内登陆或消费果的会员比率。
会员流失率:指一段时间内没有消费的会员占会员总数的比率。
1.6 财务指标
新客成本:为了争取到新客户的点击、注册或购买,平均每个新客户消耗掉的营销费用就是新客成本。
单人成本:即营销成本(营销费用+配合成本)除以访客数(UV),这个指标不去区分访客是否是新访客,是否注册,是否购买,也就是不考虑具体的转化情况。
单笔订单成本:营销成本除以获取的订单数,不区分订单来源,以成交结果为导向。
费销比:即费用比例,营销成本除以订单金额,其倒数就是 ROI,即投入一元钱能带来的订单金额。
物流相关的财务指标,包括仓储费占比,物流费占比等。
2. Google 搜索引擎是如何对搜索结果进行排序的,(请用自己的语言描述 PageRank 算法。)
PageRank 认为,一个节点对系统施加影响的结果,就是与它相连的节点也具有一定的影响力。我们可以把这些问题用图(graph)来表述一下。如图是一个有向图,包含了 4 个节点,以及 4 条边。边的起点是一个网页、论文或者人,终点指向的是起点所引用的网页、论文或者人。Node1 节点引用 node0 节点,表示前者从后者获取信息、知识。引用其他节点就是获益;反过来讲,被他人引用就是在传播。
假设一个节点的影响力值是 PR。Node0 节点的影响力就是 PR(node0)=PR(node1),类似的,node1 的影响力就是 PR(node1)=PR(node2)+PR(node3)+PR(node4)。这是 PageRank 的第一个模块。看起来很简单的样子,实际上给我们留了一个问题:各个节点的 PR 值计算是存在依赖的,得先计算出 PR(node1)才能计算 PR(node0)。也就是说,我们需要首先把所有未被引用的节点的 PR 值算出来(一般默认是 1.0);然后把以它们为源头、只和源头相连、距离为 1 的节点的 PR 值算出来;接着计算距离为 2、只和已经具有 PR 值节点相连的,所有节点的 PR 值;直到所有的节点都有 PR 值为止。这个计算方法复杂度比较高,不实用。PageRank 算法的第二个模块提供了一个复杂度较低的算法,用来较快地、近似的求出各个节点的 PR。PageRank 算法为所有的节点设置了一个初始得分(通常是 1.0),然后用前面所述的 PR 值计算公式更新所有节点的 PR 值,不断更新,直到 PR 值收敛。
互联网这样的图里存在很多孤立节点,即不被其他节点引用的网页。PageRank 增加了一个策略,就是为所有的节点设置一个最小得分,使得搜索用户有一定几率检索到这些网页。具体做法是为 PR 值的计算公式增加一个阻尼系数:PR(node1)=(1-d)+ d*(PR(node2)+PR(node3)+PR(node4))
式中,d 是一个取值范围为[0,1]的数,物理含义是搜索用户随机看到这个网页的概率,实际作用相当于对 PR 值做了一个平滑、把非孤立节点的 PR 值转移给孤立节点一些。
评论