⑴ 小家电电商用户画像分析
CN公司是一家主营家电类目的电商公司,最近小家电类目的订单数量、产品浏览量、搜索数量等都有所下降,目前计划对小家电类目进行一次季末促销活动,从用户画像特征方向给营销活动建议,以降低产品库存,提高小家电类目的销量。
活动的受众群体定位
受众群体的消费偏好
活动的推送时间
数据主要来源于网站过去保存的用户信息表和用户在2014-11-18至2014-12-18间一个月的行为记录,用户信息表主要记录了用户ID、性别、年龄、省、市、婚姻状况、学历和职业信息,订单表的主要字段有用户ID,商品ID,行为类型,商品种类,发生时间。
out:
out:
总共记录了222条用户的信息,都没有缺失值。
out:
男性用户占比52.7%,女性用户占比47.3%,男性比女性稍多些。
得到新的一列按年龄分组的情况
用户主要集中在25-40岁之间,以中青年为主,20岁以下的年轻用户和40岁以上的中老年用户较少。
out:
用户最多的是广东省,有52人,其次是北京,49人,上海有35人,用户主要集中在北上广等发达省市。
out:
同样,在城市方面用户也主要集中在北上广等主要发达城市中。
out:
已婚用户有139人,占62.6%,未婚用户有83人,占37.4%,用户以已婚用户为主,说明小家电类目更受家庭用户喜爱。
用户主要以本科学历为主。
out:
用户的职业一般为互联网从业人员、公务员及白领,主要以消费水平较高、工作较稳定、对生活品质有一定要求的消费群体为主,这也跟城市、学历有关。
有25万多条数据,没有缺失值。
out:
out:
从图中可以看出,晚上9点到10点的下单用户是最多的。
out:
周四的下单人数是最多的,达到38137,其他天的下单人数也能达到3万以上。
out:
下单次数排名前三的三个商品ID为“258745390”,“147908099”,“15909257”,其中“258745390”的下单次数达到109次。
out:
最受欢迎的五大商品种类为“13230”,“5894”,“1863”,“6513”,“5027”,其中“13230”的下单次数达到10383次。
由此,我们可以得到一个典型用户画像:
男性,年龄在30岁左右,一线城市居住,已婚,本科学历,并且在一家互联网公司任职,收入较高,注重追求生活品质,喜欢在周四到周五晚上的9点到10点下单,最喜欢的商品是“258745390”,最喜欢的商品大类为“13230”。(从性别、年龄、地区、婚育、学历、职业、收入、下单时间、消费偏好、价格区间等方面分析)
所以对于此次营销活动,可以在周四和周五晚上七点到八点的时间里,对相关用户进行推送,主打商品大类“13230”里的相关产品。
⑵ 电商-用户画像分析
用户画像是通过分析用户的基础信息、特征偏好、社会属性等各维度的数据,刻画出用户的信息全貌,它是建立在一系列属性数据之上的目标用户模型。
用户画像的本质是一个用以描述用户需求的工具。用户画像一般是产品设计、运营人员从用户群体中抽象出来的典型用户,从中可以挖掘用户价值,提供个性化推荐、精准营销等服务。
用户画像主要应用有:
城市云词条
一天当中,用户活跃时段集中在晚上18:00~22:00。
计算加工流程:
behavior_type 的内容
计算加工流程:
计算加工流程:
总体上看,访问天数多的访客比访问天数少的访客数量多,且以20次左右为拐点,因此定义访问天数小于20次的为低活跃,访问天数大于等于20次的定义为高活跃。此定义只是从用户的分布角度出发,工作中当从业务出发定义是否活跃。
RFM:
最近一次消费 (Recency)
消费频率 (Frequency)
消费金额 (Monetary)
注:访问异常的那天为双12
⑶ 人人都看得懂的电商用户画像
问:真的是人人都看得懂的电商用户画像?
汪:其实,还包括非人类,如:运营喵,程序猿,射鸡狮……
上图的2个描述即是一个典型的用户画像案例。(吼,怎么有种强行配CP的即时感~)
“Persona”的概念最早是由“交互设计之父” Alan Cooper提出,他认为 “Personas are a concrete representation of target users.” 即用户画像是真实用户的虚拟代表,是建立在一系列真实数据之上形成的目标用户模型。
简而言之,用户画像其实就是“用户信息标签化”的梳理,结合产品业务的需要,给不同群体的用户特征贴上合适的标签。
从电商产品的角度看,通过分析用户的个人基本信息以及在使用产品过程中的行为轨迹如:浏览、点赞、加入购物车、下单、使用支付方式等等,用标签把用户的典型特征描述出来,提炼以下用户信息卡片:
1、 基本属性
往往在注册时引导获取,如手机号码、性别、年龄、教育程度、所属地区等等
2、 行为特征
通过分析浏览、购买行为,例如收藏母婴店铺、多次参加母婴专场满减活动等等,可以判断这是一个新晋父母,对优惠活动敏感度强;
3、 购买能力
通过分析用户的订单金额和次数,购买品牌偏好,推算出其客单价、用户是否是高端中户、购买频次、是活跃用户还是沉睡用户等等;
4、 社交特征
分析商品分享给好友的频次、收货人电话和地址的数量,可以研究该用户的社交情况;
5、 心理特征
分析用户参加促销活动的频次,优惠券消耗的情况、同一品牌、店铺的复购率等维度,可以推算用户对大促的敏感度,对平台或者品牌的忠诚度;
6、 兴趣爱好特征
用户浏览、收藏、关注店铺的类型,加入购物车、提交订单的商品类别,可以分析出用户对某些品牌、品类的偏好度,从而进行某个品类的专场营销活动。
举个栗子:
挨踢宅男小马哥关注了66家动漫手办店铺,他的用户标签可能是“动漫达人”,如果平台或商家有动漫周边大促的活动上线,会优先将活动信息推送给这类的目标用户。
常见电商用户标签: 动漫达人、数码发烧友、潮妈、游戏奶爸、单身贵族、家庭用户、持家党、尝鲜党、败家党
正如“一千个人心中有一千个哈姆雷特” ,用户对产品的需求存在差异性和冲突性,不同的用户对产品的类型、内容偏好,营销敏感度的反响都存在偏差。
“用户画像”通过算法、用户模型,提炼用户群体的典型标签, 一方面可以让团队成员在产品需求设计的过程中能够相对客观、合理地将注意力在目标用户群的动机和行为上进行产品设计;另一方面也助力于提升营销推广的精准度,提高信息获取的效率,促成产品需求优先级的决策。
例如:应用push、短信、邮件、个性化专题展示,提高用户购买转化率。(终于为败家指数越发上升找到一个完美的借口~)
如,地域分布、购买时段、品牌偏好、用户价值大小统计
如:喜欢上的用户有多少?喜欢上的人群中,男、女比例和年龄分段是怎么样的?单身的有多少呀?(怎么感觉在操心用户的终身大事org)
特征、行为关联规则,如:商品搭配购买、关联购买,推荐购买,贴心为用户推荐符合其口味的品类,沉浸在“买买买”的愉快体验中。(真是毫不设防啊……)
构建用户画像是为了还原用户信息,确保信息的客观真实性,因此有一个大原则必须遵循:数据来源于所有用户相关的真实数据。
构建用户画像的过程可以归结为以下三步:
主要包括用户网络行为数据、网站内行为数据、用户内容偏好数据、用户交易数据;
通过对采集数据的处理,进行行为建模,以抽象出用户的标签,通过数学算法模型尽可能地排除用户的偶然行为。涉及的技术点:文本挖掘、自然语言处理、机器学习、预测算法以及聚类算法。(Ho~程序猿GG的亮技能的时刻来了)
在此阶段,需要结合用户模型来给用户贴标签,如:
通过判断+聚类算法判断用户的忠诚度
根据用户购买服装鞋帽等用品判断
判断用户对于网站的价值,筛选不同维度用户来进行针对性推广,对提高用户留存率非常有用
根据用户对“汽车”话题的关注或购买相关产品的情况来判断用户是否有车、是否准备买车,进而推送汽车相关的商品,甚至保险服务;
此外,还有流失用户模型、数码用户模型、优惠敏感用户模型等等。
通过记录、抓取用户的基本属性、购买能力、行为特征、兴趣爱好、社交网络等数据进行分析,创建、具体化用户画像。
用户画像有其自身的特性和局限性,例如无法100%地描述一个人,且具有时效性,因此,需要根据用户画像的基础数据持续更新和修正,同时要善于从已知数据中具象化出新的标签使用户画像越来越鲜活立体,发挥其参考指引价值。
不同的公司、团队获取数据、提炼用户特征方式均有所不同,大的公司会自建数据分析系统以及有强大的用研和数据分析团队支撑,而稍小一些的公司更多借力于第三方平台提取数据或开展细分用户群的用户调研工作。
1、 用户画像一定要建立在真实的数据源基础上,否则可能会导致产品、运营的一系列方向决策错误;
2、团队成员对用户画像的认知和认同不容小觑,应该在项目的不同阶段都尽量让团队成员参与进来;
3、用户画像具有时效性,必须阶段性地更新修正,定期更新数据分析时间周期和方向维度,以及时了解市场和用户的变化趋势,保持用户画像的市场适用性。
4、不要神化用户画像的作用和意义,甚至许多公司产品对这块的研究还是缺失的。正确合理的用户画像可以更好地促进公司产品发展以及更好地辅助产品方向决策。
参考素材:
1、易观智库:大数据下的用户分析及用户画像
2、邱胜昌老师慕课网:电商大数据应用之用户画像
3、杨步涛:基于用户画像的大数据挖掘实践
⑷ 电商平台的用户画像标签体系建设
电商平台连接了卖家和买家两端,最终目的都是促进交易,从而追求更高的销售额。提高人货匹配度是促进交易的关键,而提高人货匹配度的关键就是“让买家找到想要的货物”。
本文结合“人、货、场”理论模型,尝试建立电商平台的用户画像标签体系。
用户在平台购物的整体流程可以概括为:进入平台、选择商品、下单付款。
可以将该过程抽象为“人、货、场”。
即用户通过什么途径进入什么商品的页面,完成选择并下单付款。
人对应用户特征、货对应商品特征、场对应渠道特征。
用户特征可以从用户的基础信息、亲属关系、位置信息、社会特征、消费特征五大维度来构建,这五大维度表明了该用户是一个怎么样的人。
商品特征可以从类目偏好和类目行为人群两个维度来构建。
1、类目偏好
类目偏好标签的定义为:用户在平台上偏好的商品种类。
2、类目行为人群
类目行为人群标签的定义为:用户在平台的指定商品类目和时间周期的互动行为。通俗一点就是用户对商品做了什么。
类目行为人群有3个要素:具体类目、行为类型、时间范围。
行为类型一共有5种,分别是搜索,点击,收藏,加购,购买。
时间范围一共有5个选项,分别是最近7天、最近15天、最近30天、最近90天、最近180天。
类目行为人群标签圈到的人群都是在指定时间范围内,对指定类目有指定行为的人群。
渠道是指用户接触到商品详细页面的途径,分为活动渠道和内容渠道。通过渠道特征可以圈定偏好某种内容形式和内容渠道的人群,以便让商品针对性地出现在这个位置。
通过“人、货、场”理论搭建起用户画像的标签体系
⑸ 电商用户画像建模
用户画像:通过算法聚合成一类实现用户信息标签化。
—确定的标签:比如用户购买了或者收藏了某个商品等
—猜测的标签:比如用户的性别,是男性的概率0.8,另外还有很多模型:孕妇模型,潜在汽车用户模型,用户价值模型
比如:用户活跃度(活跃,沉睡,流失,未购买)
用户分群:电脑达人,数码潮人,家庭用户,网购达人,奶爸奶妈,单身贵族,闪购用户,时尚男女等
--根据用户消费的情况来提取的客户标签,用以了解用户的消费情况,消费习惯
客户消费订单表标签:
购买信息:客户ID,第一次消费时间,最近一次消费时间,首单距今时间,尾单距今时间,近30/60/90天购买次数/购买金额(不含退拒),最大/最小消费金额,累计消费次数/金额(不含退拒)
累计使用代金券金额,客单价(含退拒),常用收货地区,常用支付方式,退货商品数量,退货商品金额,拒收商品金额/数量,最近一次退货时间,各地点下单总数/总额,上下午下单总数/总额
购物车信息:最近30天购物车商品件数/提交商品件数/购物车成功率/购物车放弃件数
提取标签的作用:
确定用户什么时候来的,多久没来了:第一次消费时间,最近一次消费时间,首单距今时间,尾单距今时间
最近消费能力:近30天购买次数(不含退拒),近30购买金额(不含退拒),近30天购买次数(含退拒),近30天购买金额(含退拒)
总体的消费情况:最小/大消费金额(可做个性化商品推荐),累计消费次数(不含退拒,可以计算客单价),累计消费金额,累计使用代金券金额(代金券爱好)
消费属性:常用收货地区,常用支付方式
购物车习惯:最近30天购物车次数,最近30天购物车提交商品件数,最近30天购物车商品件数,最近30天购物车放弃件数,最近30天购物车成功率
退货和习惯特征:退货商品数量,拒收商品数量,退货商品金额,拒收商品金额,最近一次退货时间
用户购物时间及地点习惯:各下单地点总数,各时间段下单总数
—根据客户购买类目的情况提取的客户标签,用以了解类目的购买人群情况
客户购买表标签:
客户ID,一级/二级/三级分类ID/名称,近30天/90天/180天购买类目次数/金额,累计购买类目次数/金额,累计购买类目次数/金额,近30天/90天/180天购物车某类目次数/金额,累计购买类目次数/金额,累计购物车类目次数/金额,最后一次购买类目时间/距今天数
--根据客户购买商店的情况提取的客户标签,用以了解商店及品牌的购买人群(做品牌营销等)
客户购买 商店表标签:
用户ID,商店ID/名称,品牌ID/名称,最近30天购物车次数/商品件数/提交商品件数/成功率/放弃件数,最后一次购物车时间,最近90天商品排除退拒商品件数/金额,最近90天货到付款订单数,最近90天退换件数/金额,最近90天拒收件数/金额.
用户购物模型:
用户忠诚度模型:
—将用户营销相关的常用标签放到一张表中,方便使用
客户营销信息表:
客户ID,营销手机号,第一个有效订单来源/地址/手机号,常用的手机号,常用的收货地址,不同收货地址的数量,客户分群,活跃状态,用户价值(重要,保持,流失等),纠结商品,纠结小时
主要来源表:
用户表,订单表,活动表,购物车表,客户品类分群模型,用户价值模型
客户活跃状态模型:
用户价值模型
--根据客户参与活动的情况提取的客户标签,用于了解用户对活动的参与情况,以进行活动的策划
客户活动信息表内容标签:
客户ID,用户促销明个度,满减促销敏感度,打折促销敏感度,换购促销敏感度,满赠促销敏感度,购买力分段,品牌偏好,品类偏好,颜色偏好,败家偏好,冲动偏好,累计积分,已用积分,可以积分,累计代金券数量/金额,已用代金券数量/金额,过期代金券数量/金额,可用代金券数量/金额
标签作用:
确定用户喜欢那种活动类型:用户促销敏感度,满减促销敏感度,满赠敏感度,打折促销敏感度,换购促销敏感度,团购促销敏感度等
促销敏感度模型:
--根据用户购买的活动类型订单数与金额数已判断其属于哪类人群
用户有什么偏好:店铺偏好,品牌偏好,品类偏好,颜色偏好
用户指数:购买力分段,败家指数,冲动指数
用户购买力高中低模型:
—从购物车,客单价来判断
用户购买力高中低端模型:
指数模型:
--根据客户访问的情况提取的客户标签以了解访问习惯
客户访问信息标签:
最近一次/第一次pc端访问日期/session/cookies/pv/使用浏览器/操作系统/,最近一次/ 第一次app端访问日期/操作系统,最近一次/第一次访问ip/访问城市/省份,近7天/15天/30天/60天/90天app端/pc端访问次数,近30天pc端/app端访问天数/访问并购买次数/访问pv/访问评价pv/ip数/,app及pc端各时间段访问的次数
该文章来自邱盛昌老师的慕课视频笔记:
链接: http://www.imooc.com/learn/460/
⑹ python是什么意思
Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。python是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。
Python由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年。像Perl语言一样,Python 源代码同样遵循 GPL(GNU General Public License)协议。
简介:
Python由荷兰数学和计算机科学研究学会的Guido van Rossum于1990 年代初设计,作为一门叫做ABC语言的替代品。Python提供了高效的高级数据结构,还能简单有效地面向对象编程。
Python语法和动态类型,以及解释型语言的本质,使它成为多数平台上写脚本和快速开发应用的编程语言,随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发。
⑺ 项目三、电商用户画像分析(上)
电商用户画像分析: 用户画像是通过分析用户的基础信息、特征偏好、社会属性等各维度的数据,刻画出用户的信息全貌,它是建立在一系列属性数据之上的目标用户模型。用户画像的本质是一个用以描述用户需求的工具。用户画像一般是产品设计、运营人员从用户群体中抽象出来的典型用户,从中可以挖掘用户价值,提供个性化推荐、精准营销等服务。
电商用户画像分析的作用:
1.导入使用的包:
2.导入数据:
3.理解数据:
order_data共有五个字段,分别为,其中behavior_type中1为浏览,2为收藏,3为加购,4为购买
1.缺失值处理:
1、用户活跃的时间
1.1 用浏览活跃时间段
1.2 用户购买活跃时间段
1.3 清除缓存:
2、关于类目的用户行为
2.1 浏览最多的类目
2.2 收藏最多的类目
2.3 加购最多的类目
2.4 购买最多的类目
3.2 近30天加购次数
3.3 近30天活跃天数
4、7天用户行为
4.2 近7天加购次数
4.3 近7天活跃次数
5.最后一次行为距今天数(今天取2014/12/18)
5.1 上次浏览距今天数
5.2 上次加购距今天数
5.3 上次购买距今天数
6.最近两次购买间隔天数
7.是否有商品浏览未下单
8.是否有商品加购未下单
9、用户属性标签
9.1 是否复购用户
9.2 访问活跃度
总体上看,访问天数多的访客比访问天数少的访客数量多,且以20次左右为拐点,因此定义访问天数小于20次的为低活跃,访问天数大于等于20次的定义为高活跃。
9.3 购买的品类是否单一
9.4 用户价值分组
可以看出大于8天为低
⑻ 数据分析网站源码户画像行吗
行。从1991年发明了万维网开始,到20年后2011年,互联网真正走向了一个新的里程碑,进入了大数据时代。伴随着对人的了解逐步深入,一个概念悄然而生:用户画像,完美地抽象出一个用户的信息全貌,可以看作企业应用大数据的根基。众所周知数据分析的时候,想要得到有价值的结论,需要掌握好的分析方法。数据分析方法有很多,用户画像分析就是常用的方法之一,数据分析网站源用户画像分析是可行得,用户画像基于自动标签系统将用户完整的画像描绘清晰,更有力的支撑运营决策。
⑼ 史上最全用户画像分析,附带案例讲解
对于互联网从业者,经常会提到一个词——用户画像。作为一名刚主要做用户画像DMP的数据PM,工作中总是会被需求方问到——
我要查看XXX的用户画像 或是 能否能够XXXX类用户的画像。 抑或是有别的产品会问到:你们是怎么做用户画像的?
然而在沟通的过程中,我发现,不同的人对用户画像的理解差异还是非常大的。有的人认为用户画像就是包含了用户的详细的信息,有的人认为用户画像是能够反映出一个群体的统计学特性,有的人认为用户画像可以做用户研究.....这些想法或多或少有一些片面的,本文就用户画像的基础知识进行说明,并结合一些DMP产品进行分析,同时对用户画像在K12产品中的应用做一说明。
1、当我们谈论DMP和用户画像时,我们在谈论什么?
此部分结合常见DMP&用户画像定义和我工作中对DMP&用户画像的定义进行说明
用户画像是DMP中非常重要的一个环节,因此将DMP和用户画像拆开进行说明
1.1DMP
1.1.1 DMP是什么?
DMP即 datamanagement system,数据管理平台,单从名称上来看,这个定义还是非常宽泛的,所以国内很多企业或者个人会将dmp的核心功能理解错。
结合我的理解,DMP其实是一个全面的数据收集,加工,整合的平台,吸收各种数据源的数据,以用户为基本单位,清洗,整理形成结构化的数据表,并进行用户标签的计算,以期能够精准的描述各种用户。
纯碎的DMP平台是指小型的、定制能力极强、中立性好的DMP技术服务商。美国DMP市场是极度细分的,中国市场是高整合的,往往DMP的需求是和DSP、SSP紧密联系在一起的,目前还很难有纯粹的DMP平台。
1.1.2 DMP可以做什么
精准营销,广告投放,个性化推荐,其他应用
1.1.3 DMP的基础架构及数据加工流程
DMP的基础架构:
DMP的数据加工流程:
1.1.5 DMP的实际应用(市面上能够看到的产品)
DMP广告平台:腾讯广点通、阿里妈妈达摩盘;
独立第三方DMP:talkingdata、神策数据;
个性化推荐:今日头条、一点资讯、淘宝、京东等;
说明:个性化推荐的应用我们能够感受到,但是背后的逻辑我们是看不到的
其他应用
1.2用户画像
1.2.1 用户画像是什么
关于用户画像,有两类定义:User Persona 和User Profile
User Persona:是产品设计、运营人员从用户群体中抽象出来的典型用户。例如,在用户调研阶段,产品经理经过调查问卷、客户访谈了解用户的共性与差异,汇总成不同的虚拟用户;
经典案例——《用户体验要素》中提到的用户画像
UserProfile:根据每个人在产品中的用户行为数据,产出描述用户的标签的集合。例如猜测这个用户是男是女,生活工作所在地,喜欢哪个明星,要买什么东西等。
本文所提到的用户画像,指的是User Profile
1.2.2 用户画像怎么做
基础数据收集:收集用户在网站内外的静态数据和动态数据;
行为建模:基于用户的基础数据,通过技术手段进行行为建模;
构建画像:通过行为建模,可以输出一系列的用户标签,每个用户的标签都可以形成一个集合,这个标签的集合可以表示出这个用户的特点。
1.2.3 用户画像的常见应用
个性化推荐(电商、资讯类产品)、风控、预测等
1.2.4 用户画像与DMP的关系
DMP是数据管理平台,可以简单理解为,把数据提供到DMP平台,DMP平台输出一系列标签,或其他想要的结果。
用户画像是输入用户数据到DMP,DMP输出了用户标签。
DMP不只可以输出用户标签,也可以输出其他的标签,比如输入文章,输出文章标签。
因此,用户画像是DMP的一个应用方向。
2 相关产品介绍
由于用户画像主要是作为底层应用,因此它的很多应用都是能感知,但不可见。比如电商平台的个性化推荐页面,资讯类App首页的个性化推荐背后,就是用户画像在发挥着作用,用户标签和内容标签/商品标签进行智能组合。
由于本人从事K12教育行业,所以只选取了两类竞品:开放DMP平台、教育类产品,其中以开放DMP平台为主。
3 竞品分析
3.1 开放DMP平台
3.1.1 产品说明
3.1.2 功能对比
达摩盘
广点通
神策数据
说明:神策数据看起来更像是一个数据分析工具,但是其底层的搭建、对数据的管理与DMP有类似的地方,并且我们可见的部分即类似BI的功能,可看作DMP在应用层的表现,因此也把它列为竞品
3.1.3界面对比
说明:由于这三个产品均需付费才可体验全部产品功能,界面主要来自于说明文档,可能与真实节面有一定出入
达摩盘-标签
达摩盘-新建标签
达摩盘-人群报表
达摩盘-人群明细
达摩盘-整体报表
广点通操作界面
广点通-创建广告
广点通-创建广告2
神策数据-用户分析-事件分析
神策数据-用户分析-用户属性
3.1.4产品底层技术架构思考对比
说明:
1)此部分内容为通过产品体验和阅读说明文档,思考抽象出可能的底层架构,并非真实情况;
2)产品底层技术架构:我们所看到的功能模块,都是由不同的技术模块相互协作实现的。产品底层技术架构描述了产品对应的底层技术模块、以及模块之间的关系。
达摩盘
神策数据
3.1.5总结
总结来看,达摩盘和广点通是DMP在互联网广告中的典型应用。DMP是定向广告投放最核心的大脑,DMP提供的用户画像,是进行定向广告投放的最核心最关键的一步。达摩盘和广点通最重要的目标是,把对的广告在对的时机,展示给对的人。
而对于神策数据,这一类数据分析工具,DMP在数据分析、数据可视化的过程中也发挥着非常重要的作用,哪类用户的哪类行为比较突出,哪类用户在未来会产生什么样的行为。
3.2教育类产品
用户画像DMP在教育类产品中的应用——
(1) 洋葱数据个性化课程制定(类似自适应学习);
用户在学习前,先进行测试,根据测试情况为用户制定个性化课程包,如下图1;
图1
用户完成学习,根据用户学习测试结果,展示可视化学习分析报告,如下图2
图2
4 用户画像怎么用?
用户画像是一个的底层产品,用户画像的应用通常难以看到。那么,用户画像该怎么用呢?结合对DMP产品和教育类产品的分析,用户画像的应用总结如下:
(1)用户标签可视化——
相关产品的功能:广点通和达摩盘将用户标签直接展示出来,用户可直接选择标签,并且对标签进行组合,选出目标用户,然后投放广告。
可借鉴场景举例:比如说,我想对今年刚报课程并且消费能力比较高且学习认真的这批学员发送一条推送消息,希望他们能够参加一场直播,促进其对知识的掌握。那么可以直接选中:新用户+消费能力高+学习认真这几个标签,然后对这部分用户发送短信。
好处:精细化运营,提高ROI;简化操作
(2)用户标签关联分析:
相关产品功能-广点通lookalike:(1)提供种子用户;(2)筛选种子用户特征;(3)将种子用户与腾讯用户进行匹配,进行人群扩展
可借鉴场景:一批用户购买了商品A,我想要找出与购买这一商品相似度比较高的用户。那么可以将这批用户的信息导入到DMP,计算出这批用户的标签,再通过关联分析,找到和这批用户相似度比较高的用户
(3)个性化推荐:
相关产品功能:个性化课程制定
可借鉴场景(以K12教育为例):
(1)针对未注册用户,根据其访问行为,为其推荐个性化课程页面,提高购买转化率;如果是通过互联网广告进来的用户,则可以为其制定个性化落地页,提高注册和购买转化;
(2)针对注册未购课,根据其浏览行为,为其推荐个性化课程页面,提高购课率;
(3)根据用户学习行为(主要是做题情况),为其制定个性化试题和学习建议。
⑽ 数据分析项目——电商平台用户画像分析
包括用户行为数据和用户基本信息数据:
重复值处理
缺失值处理
数据格式处理:
日期格式的转换 astype()
查看有无重复值:首先看使用df.info查看各个字段的记录数,再看去除重复值后的数量。以此判断有无重复数据。
去重重复值可以使用函数drop_plicates()
通过df.info查看数据格式
看到time是object类型的,不适合处理。同时我们一般将数据分为日期和时间格式,因此对其进行拆分处理。
为各个时段打标,将时段分为'凌晨'、'上午'、'中午'、'下午'、'晚上'
知识点:pd.cut函数,区间分割
查看空值,并计算数量。可以看到并无空值。
在订单表中按照(用户,时段)分组,取每个时段的记录数(订单数):
这里的操作流程与hive-sql类似,我们需要先把max算出来,再去关联。
将生成的标签加入标签表:
同理,可统计出用户购买的活跃时间段,在此不赘述,仅展示结果
分析用户最喜欢的类目,从而便于我们为其进行推荐。
最终得到标签表:
通过分析用户分析最近的行为,来判断该用户是否活跃、流失
分析近30天的活跃天数,只要有浏览、收藏、加购和购物四种行为之一就认为是活跃。
结果如下:
我们可以通过查看所有用户30天活跃天数的分布情况,来确认一个分类的标准,判断某个用户是否活跃。
用户30天活跃天数分布图如图:
同理,可分析用户近7天的行为,包括其购物次数和活跃天数。
与上述操作类似,展示结果:
明确今天的日期,在本项目中,“今天”指“2014-12-19”,然后统计订单表中用户某种行为的最大日期与当前日期的差值。
使用的函数是:datetime.strptime: new datetime parsed from a string (like time.strptime()) ,将字符串转为date格式,以方便我们做日期运算
结果如图:
使用日期的diff函数
返回结果
RFM分组是指按照最近一次消费 (Recency)、消费频率 (Frequency)和消费金额(Monetary)进行分组
最近一次消费,我们按照最后一次购物距今的天数进行分组,同样是观看用户的一个分布情况,然后看如何进行分类。
消费频率,这里放宽要求,按照用户的30天活跃天数进行分类
消费金额,本次不涉及金额的统计。
因此,我们可以根据活跃度分类和最近一次消费将用户划分为四类:
结果如图
可以看到在第8天前后,用户有明显的分层,因此按照8天对其进行划分,最后一次消费距今天数小于8天的,认为最近有消费,大于8天的认为最近无消费
返回结果:
通过value_counts查看每个值的出现次数:
上述返回的结果值是:
如果值为空,说明无相应的行为,对浏览未购买的数据记录进行打标
以上的步骤到商品粒度,下面对用户进行统计,即只要用户有浏览未下单的行为就对其进行打标
返回的结果如图:
加购未下单同上述步骤
分析平台用户的年龄、学历、性别、城市、职业、婚姻情况等,以便于我们去分析我们的典型用户是什么。
从上图可以看出,平台用户中男性居多,女性较少。
值的分层可以使用pd.cut函数
从年龄分布图中,可以看出平台的用户以25岁-40岁的用户居多。青年人和中老年用户较少。
返回结果如下图,从结果中可以看到来自北上广深的用户占绝大部分比例。
从婚姻分布情况中可以看到,平台用户中有超过60%的用户为已婚。
使用该平台的用户大部分拥有大学及以上的学历
使用该平台的用户大部分为互联网从业人群
首先查看这一个月的时间跨度用户每天的购物情况:
从上图可以看出,该平台每天的下单用户数比较平稳,有一些周期性因素在其中,可能是每周周中和周末的购物情况不同。同时,注意到12.12这一天购物用户激增,可能是12.12购物节的因素。
再分析下用户喜欢在周几下单,哪个时间下单
从图中我们可以看到用户的喜欢的购物时间:周五,晚上9点。上午购物的人数都比较少,主要集中在下午和晚上。
通过用户的下单情况,我们可以对每周的下单用户进行分层,将其分为活跃用户、不活跃用户和回流用户。
最终结果
通过面积图看一下每周不同类型用户的比例情况:
复购率:一周内购买多次(>1)的用户占总用户的比例
从中可以看到,5周的复购用户都在50%以上,47周和51周的复购率较低,可能是因为数据不完整的原因。
用户最喜欢购买的品类?
用户最多收藏的品类?
从结果可见,用户最喜欢购买的品类前五名是6344、12189、5232、1863和4370,用户收藏最多的品类是13230、5894、1863、6513和5027。
转换率=浏览该商品的用户数/购买该商品的用户数
最终结果如图:
查看转换率的分布情况: