Power BI电商用户行为可视化分析
一、项目背景基于千万级的淘宝用户的使用记录,对淘宝用户的行为进行分析,具体指标包括:日PV、日UV、不同用户行为的PV、用户复购率、活跃用户消费率,用户分层情况等。流量指标分析:用户行为分析:二、 分析思路梳理1.数据来源阿里天池官方发布的1万用户在2014年双十二期间的行为记录,数据量达1200万+。数据下载地址:数据集-阿里云天池2.数据结构user_id:用户IDitem_id:商品IDbe
一、项目背景
基于千万级的淘宝用户的使用记录,对淘宝用户的行为进行分析,具体指标包括:日PV、日UV、不同用户行为的PV、用户复购率、活跃用户消费率,用户分层情况等。
流量指标分析:

用户行为分析:

二、 分析思路梳理
1.数据来源
阿里天池官方发布的1万用户在2014年双十二期间的行为记录,数据量达1200万+。
数据下载地址:数据集-阿里云天池
2.数据结构
user_id:用户ID
item_id:商品ID
behavior_type:用户行为类型(包含1点击、2收藏、3加购物车、4支付)
user_geohash:地理位置
item_category:商品类别ID
time:记录时间
3.数据清洗
导入mysql进行数据整理。
重复值
有重复,但是根据业务理解,不需要作处理。代码如下:
select *, count(user_id) from tianchi_train group by user_id, item_id, behavior_type, item_id, time having count(user_id) > 1;
异常值
查看time的范围,behaviou_type的类型。代码如下:
select min(time), max(time) from tianchi_train; select distinct behavior_type from tianchi_train;
缺失值
查看各字段的数量,发现time有一条缺失。代码如下:
select count(user_id), count(item_id), count(behavior_type), count(item_id), count(time) from tianchi_train;
查看找到它,删除。代码如下:
select * from tianchi_train where time is null; delete from tianchi_train where time is null;
数据一致化处理
对time字段分成日期date和时段hours两个字段;为了便于理解,把behavior_type的数字改为英文简写。代码如下:
# 把time分成date和hours两个字段,然后删除time alter table tianchi_train add column date date; alter table tianchi_train add column hours varchar(255); update data set date = left(time, 10); update data set hours = substring(time, 12,2); # 把behavior_type 分别更名为pv, col, cart, buy update tianchi_train set behavior_type = ( case when behavior_type = 1 then 'pv' when behavior_type = 2 then 'col' when behavior_type = 3 then 'cart' when behavior_type = 4 then 'buy' else '其他' end ); # 删除time这一列 alter table tianchi_train drop time;
三、数据分析
1.AARRR模型
统计整体和每月的用户浏览数、加购数、收藏数和支付数,绘制漏斗模型,分析流量转化环节的流失情况。

用户在浏览页面后出现了极大的流失率,这个根据前面的视图可以看出每个用户的用户行为总数中,浏览次数占有非常高的比例。
从浏览到收藏的转化率为2.1%,用户花了大量时间寻找合适的产品。可优化网站筛选、关键词搜索功能,推荐更适合用户的商品,方便用户迅速获取信息。
从加购到购买的转化率约为35.05%。可针对加购未购买产品细分,采用提供优惠券、推荐同款商品等促销方法。▼
2.每日流量分布情况



从12月08日开始,pv、收藏数、加购数、支付数的值均增大,12月5日出现小范围减小;12月12日当天各个值激增,达到高点,次日骤降,回归平均水平。▼
活跃用户消费率

在双12当天,打开过淘宝的人,大约17.07%的活跃用户下单消费了,转化率一般。
在其他时间,每天都保持大约5%的转化,转化率在平时较低。
3.用户价值RMF模型分析
仅在会员(购买过商品的用户)范围内,进行价值划分,R/F等级为1-5,由于本项目的数据不涉及M(Monetary),所以只做4类划分。
通过RFM模型,了解每位顾客的特性,对目标人群进行精准化的营销。
高价值客户,R高F高。经常在网站购物,并形成习惯,做好维护即可。
深耕客户,R高F低。这类用户粘性不强,近期有消费行为,可能是针对需要的商品直接下单,不会过于频繁地进行其他商品的浏览、购买。可推荐更符合用户喜好、性价比高商品,吸引其进行购买,逐渐建立消费习惯。
唤回客户,R低F高。最近没有购买行为,可以通过短信等场外提醒,引导其入场参与优惠活动,尽快完成下次购买行为。
挽留客户,R低F低。该类用户容易流失,占比31.09%,可提升空间大,运营活动可重点针对这部分用户,通过拼团打折、积分兑换、捆绑销售等活动唤起用户注意力,提升用户兴趣。


四、业务建议
1.关注总体指标,提升用户活跃度
对比竞品网站,在商品的定价、商品陈列故事、商品详情描述等方面做出改进,减少用户跳失。
大型活动至少提前1—2周进行预热,可活跃用户,提升用户留存率;日常的推新、促销可选择在周四至周六这一时间段进行。
优化网站筛选、关键词搜索功能,推荐更适合用户的商品,方便用户迅速获取信息;针对加购未购买产品细分,采用提供优惠券、推荐同款商品等促销方法,提升用户行为转化率,促进更快、更顺利完成购买行为。
2.了解用户特性,差异化营销
做好重要价值用户的维护工作,推荐更符合重要深耕用户喜好、性价比高商品,吸引其进行购买,逐渐建立消费习惯。通过发送短信等场外提醒给重要唤回用户的方式,引导其入场参与优惠活动,尽快完成下次购买行为。运营活动可重点关注容易流失的重要价值用户,通过拼团打折、积分兑换、捆绑销售等活动唤起用户注意力,帮助用户建立对平台的兴趣。
更多推荐

所有评论(0)