一、项目背景

基于千万级的淘宝用户的使用记录,对淘宝用户的行为进行分析,具体指标包括:日PV、日UV、不同用户行为的PV、用户复购率、活跃用户消费率,用户分层情况等。

流量指标分析:


用户行为分析:

 

二、 分析思路梳理

1.数据来源

阿里天池官方发布的1万用户在2014年双十二期间的行为记录,数据量达1200万+。

数据下载地址:数据集-阿里云天池

2.数据结构

user_id:用户ID

item_id:商品ID

behavior_type:用户行为类型(包含1点击、2收藏、3加购物车、4支付)

user_geohash:地理位置

item_category:商品类别ID

time:记录时间

3.数据清洗

导入mysql进行数据整理。

重复值

有重复,但是根据业务理解,不需要作处理。代码如下:

select *, count(user_id) from tianchi_train
group by user_id, item_id, behavior_type, item_id, time 
having count(user_id) > 1;

异常值

查看time的范围,behaviou_type的类型。代码如下:

select min(time), max(time) from tianchi_train;
select distinct behavior_type from tianchi_train;

缺失值

查看各字段的数量,发现time有一条缺失。代码如下:

select count(user_id), count(item_id), count(behavior_type), count(item_id), count(time)
from tianchi_train;

查看找到它,删除。代码如下:

select * from tianchi_train where time is null;
delete from tianchi_train where time is null;

数据一致化处理

对time字段分成日期date和时段hours两个字段;为了便于理解,把behavior_type的数字改为英文简写。代码如下:

# 把time分成date和hours两个字段,然后删除time
alter table tianchi_train add column date date;
alter table tianchi_train add column hours varchar(255);
update data set date = left(time, 10);
update data set hours = substring(time, 12,2);

# 把behavior_type 分别更名为pv, col, cart, buy
update tianchi_train 
set behavior_type = (
	case 
	when behavior_type = 1 then 'pv' 
	when behavior_type = 2 then 'col'
	when behavior_type = 3 then 'cart'
	when behavior_type = 4 then 'buy'
	else '其他'
	end
);

# 删除time这一列
alter table tianchi_train drop time;

三、数据分析

1.AARRR模型 

统计整体和每月的用户浏览数、加购数、收藏数和支付数,绘制漏斗模型,分析流量转化环节的流失情况。

用户在浏览页面后出现了极大的流失率,这个根据前面的视图可以看出每个用户的用户行为总数中,浏览次数占有非常高的比例。

从浏览到收藏的转化率为2.1%,用户花了大量时间寻找合适的产品。可优化网站筛选、关键词搜索功能,推荐更适合用户的商品,方便用户迅速获取信息。

从加购到购买的转化率约为35.05%。可针对加购未购买产品细分,采用提供优惠券、推荐同款商品等促销方法。▼

2.每日流量分布情况

 

 

从12月08日开始,pv、收藏数、加购数、支付数的值均增大,12月5日出现小范围减小;12月12日当天各个值激增,达到高点,次日骤降,回归平均水平。▼

活跃用户消费率

在双12当天,打开过淘宝的人,大约17.07%的活跃用户下单消费了,转化率一般。

在其他时间,每天都保持大约5%的转化,转化率在平时较低。

3.用户价值RMF模型分析

仅在会员(购买过商品的用户)范围内,进行价值划分,R/F等级为1-5,由于本项目的数据不涉及M(Monetary),所以只做4类划分。

通过RFM模型,了解每位顾客的特性,对目标人群进行精准化的营销。

高价值客户,R高F高。经常在网站购物,并形成习惯,做好维护即可。
深耕客户,R高F低。这类用户粘性不强,近期有消费行为,可能是针对需要的商品直接下单,不会过于频繁地进行其他商品的浏览、购买。可推荐更符合用户喜好、性价比高商品,吸引其进行购买,逐渐建立消费习惯。
唤回客户,R低F高。最近没有购买行为,可以通过短信等场外提醒,引导其入场参与优惠活动,尽快完成下次购买行为。
挽留客户,R低F低。该类用户容易流失,占比31.09%,可提升空间大,运营活动可重点针对这部分用户,通过拼团打折、积分兑换、捆绑销售等活动唤起用户注意力,提升用户兴趣。

 

 四、业务建议

1.关注总体指标,提升用户活跃度

对比竞品网站,在商品的定价、商品陈列故事、商品详情描述等方面做出改进,减少用户跳失。

 大型活动至少提前1—2周进行预热,可活跃用户,提升用户留存率;日常的推新、促销可选择在周四至周六这一时间段进行。

优化网站筛选、关键词搜索功能,推荐更适合用户的商品,方便用户迅速获取信息;针对加购未购买产品细分,采用提供优惠券、推荐同款商品等促销方法,提升用户行为转化率,促进更快、更顺利完成购买行为。

2.了解用户特性,差异化营销

做好重要价值用户的维护工作,推荐更符合重要深耕用户喜好、性价比高商品,吸引其进行购买,逐渐建立消费习惯。通过发送短信等场外提醒给重要唤回用户的方式,引导其入场参与优惠活动,尽快完成下次购买行为。运营活动可重点关注容易流失的重要价值用户,通过拼团打折、积分兑换、捆绑销售等活动唤起用户注意力,帮助用户建立对平台的兴趣。
 

Logo

电商企业物流数字化转型必备!快递鸟 API 接口,72 小时快速完成物流系统集成。全流程实战1V1指导,营造开放的API技术生态圈。

更多推荐