⑴ 小家電電商用戶畫像分析
CN公司是一家主營家電類目的電商公司,最近小家電類目的訂單數量、產品瀏覽量、搜索數量等都有所下降,目前計劃對小家電類目進行一次季末促銷活動,從用戶畫像特徵方向給營銷活動建議,以降低產品庫存,提高小家電類目的銷量。
活動的受眾群體定位
受眾群體的消費偏好
活動的推送時間
數據主要來源於網站過去保存的用戶信息表和用戶在2014-11-18至2014-12-18間一個月的行為記錄,用戶信息表主要記錄了用戶ID、性別、年齡、省、市、婚姻狀況、學歷和職業信息,訂單表的主要欄位有用戶ID,商品ID,行為類型,商品種類,發生時間。
out:
out:
總共記錄了222條用戶的信息,都沒有缺失值。
out:
男性用戶佔比52.7%,女性用戶佔比47.3%,男性比女性稍多些。
得到新的一列按年齡分組的情況
用戶主要集中在25-40歲之間,以中青年為主,20歲以下的年輕用戶和40歲以上的中老年用戶較少。
out:
用戶最多的是廣東省,有52人,其次是北京,49人,上海有35人,用戶主要集中在北上廣等發達省市。
out:
同樣,在城市方面用戶也主要集中在北上廣等主要發達城市中。
out:
已婚用戶有139人,佔62.6%,未婚用戶有83人,佔37.4%,用戶以已婚用戶為主,說明小家電類目更受家庭用戶喜愛。
用戶主要以本科學歷為主。
out:
用戶的職業一般為互聯網從業人員、公務員及白領,主要以消費水平較高、工作較穩定、對生活品質有一定要求的消費群體為主,這也跟城市、學歷有關。
有25萬多條數據,沒有缺失值。
out:
out:
從圖中可以看出,晚上9點到10點的下單用戶是最多的。
out:
周四的下單人數是最多的,達到38137,其他天的下單人數也能達到3萬以上。
out:
下單次數排名前三的三個商品ID為「258745390」,「147908099」,「15909257」,其中「258745390」的下單次數達到109次。
out:
最受歡迎的五大商品種類為「13230」,「5894」,「1863」,「6513」,「5027」,其中「13230」的下單次數達到10383次。
由此,我們可以得到一個典型用戶畫像:
男性,年齡在30歲左右,一線城市居住,已婚,本科學歷,並且在一家互聯網公司任職,收入較高,注重追求生活品質,喜歡在周四到周五晚上的9點到10點下單,最喜歡的商品是「258745390」,最喜歡的商品大類為「13230」。(從性別、年齡、地區、婚育、學歷、職業、收入、下單時間、消費偏好、價格區間等方面分析)
所以對於此次營銷活動,可以在周四和周五晚上七點到八點的時間里,對相關用戶進行推送,主打商品大類「13230」里的相關產品。
⑵ 電商-用戶畫像分析
用戶畫像是通過分析用戶的基礎信息、特徵偏好、社會屬性等各維度的數據,刻畫出用戶的信息全貌,它是建立在一系列屬性數據之上的目標用戶模型。
用戶畫像的本質是一個用以描述用戶需求的工具。用戶畫像一般是產品設計、運營人員從用戶群體中抽象出來的典型用戶,從中可以挖掘用戶價值,提供個性化推薦、精準營銷等服務。
用戶畫像主要應用有:
城市雲詞條
一天當中,用戶活躍時段集中在晚上18:00~22:00。
計算加工流程:
behavior_type 的內容
計算加工流程:
計算加工流程:
總體上看,訪問天數多的訪客比訪問天數少的訪客數量多,且以20次左右為拐點,因此定義訪問天數小於20次的為低活躍,訪問天數大於等於20次的定義為高活躍。此定義只是從用戶的分布角度出發,工作中當從業務出發定義是否活躍。
RFM:
最近一次消費 (Recency)
消費頻率 (Frequency)
消費金額 (Monetary)
註:訪問異常的那天為雙12
⑶ 人人都看得懂的電商用戶畫像
問:真的是人人都看得懂的電商用戶畫像?
汪:其實,還包括非人類,如:運營喵,程序猿,射雞獅……
上圖的2個描述即是一個典型的用戶畫像案例。(吼,怎麼有種強行配CP的即時感~)
「Persona」的概念最早是由「交互設計之父」 Alan Cooper提出,他認為 「Personas are a concrete representation of target users.」 即用戶畫像是真實用戶的虛擬代表,是建立在一系列真實數據之上形成的目標用戶模型。
簡而言之,用戶畫像其實就是「用戶信息標簽化」的梳理,結合產品業務的需要,給不同群體的用戶特徵貼上合適的標簽。
從電商產品的角度看,通過分析用戶的個人基本信息以及在使用產品過程中的行為軌跡如:瀏覽、點贊、加入購物車、下單、使用支付方式等等,用標簽把用戶的典型特徵描述出來,提煉以下用戶信息卡片:
1、 基本屬性
往往在注冊時引導獲取,如手機號碼、性別、年齡、教育程度、所屬地區等等
2、 行為特徵
通過分析瀏覽、購買行為,例如收藏母嬰店鋪、多次參加母嬰專場滿減活動等等,可以判斷這是一個新晉父母,對優惠活動敏感度強;
3、 購買能力
通過分析用戶的訂單金額和次數,購買品牌偏好,推算出其客單價、用戶是否是高端中戶、購買頻次、是活躍用戶還是沉睡用戶等等;
4、 社交特徵
分析商品分享給好友的頻次、收貨人電話和地址的數量,可以研究該用戶的社交情況;
5、 心理特徵
分析用戶參加促銷活動的頻次,優惠券消耗的情況、同一品牌、店鋪的復購率等維度,可以推算用戶對大促的敏感度,對平台或者品牌的忠誠度;
6、 興趣愛好特徵
用戶瀏覽、收藏、關注店鋪的類型,加入購物車、提交訂單的商品類別,可以分析出用戶對某些品牌、品類的偏好度,從而進行某個品類的專場營銷活動。
舉個栗子:
挨踢宅男小馬哥關注了66家動漫手辦店鋪,他的用戶標簽可能是「動漫達人」,如果平台或商家有動漫周邊大促的活動上線,會優先將活動信息推送給這類的目標用戶。
常見電商用戶標簽: 動漫達人、數碼發燒友、潮媽、游戲奶爸、單身貴族、家庭用戶、持家黨、嘗鮮黨、敗家黨
正如「一千個人心中有一千個哈姆雷特」 ,用戶對產品的需求存在差異性和沖突性,不同的用戶對產品的類型、內容偏好,營銷敏感度的反響都存在偏差。
「用戶畫像」通過演算法、用戶模型,提煉用戶群體的典型標簽, 一方面可以讓團隊成員在產品需求設計的過程中能夠相對客觀、合理地將注意力在目標用戶群的動機和行為上進行產品設計;另一方面也助力於提升營銷推廣的精準度,提高信息獲取的效率,促成產品需求優先順序的決策。
例如:應用push、簡訊、郵件、個性化專題展示,提高用戶購買轉化率。(終於為敗家指數越發上升找到一個完美的借口~)
如,地域分布、購買時段、品牌偏好、用戶價值大小統計
如:喜歡上的用戶有多少?喜歡上的人群中,男、女比例和年齡分段是怎麼樣的?單身的有多少呀?(怎麼感覺在操心用戶的終身大事org)
特徵、行為關聯規則,如:商品搭配購買、關聯購買,推薦購買,貼心為用戶推薦符合其口味的品類,沉浸在「買買買」的愉快體驗中。(真是毫不設防啊……)
構建用戶畫像是為了還原用戶信息,確保信息的客觀真實性,因此有一個大原則必須遵循:數據來源於所有用戶相關的真實數據。
構建用戶畫像的過程可以歸結為以下三步:
主要包括用戶網路行為數據、網站內行為數據、用戶內容偏好數據、用戶交易數據;
通過對採集數據的處理,進行行為建模,以抽象出用戶的標簽,通過數學演算法模型盡可能地排除用戶的偶然行為。涉及的技術點:文本挖掘、自然語言處理、機器學習、預測演算法以及聚類演算法。(Ho~程序猿GG的亮技能的時刻來了)
在此階段,需要結合用戶模型來給用戶貼標簽,如:
通過判斷+聚類演算法判斷用戶的忠誠度
根據用戶購買服裝鞋帽等用品判斷
判斷用戶對於網站的價值,篩選不同維度用戶來進行針對性推廣,對提高用戶留存率非常有用
根據用戶對「汽車」話題的關注或購買相關產品的情況來判斷用戶是否有車、是否准備買車,進而推送汽車相關的商品,甚至保險服務;
此外,還有流失用戶模型、數碼用戶模型、優惠敏感用戶模型等等。
通過記錄、抓取用戶的基本屬性、購買能力、行為特徵、興趣愛好、社交網路等數據進行分析,創建、具體化用戶畫像。
用戶畫像有其自身的特性和局限性,例如無法100%地描述一個人,且具有時效性,因此,需要根據用戶畫像的基礎數據持續更新和修正,同時要善於從已知數據中具象化出新的標簽使用戶畫像越來越鮮活立體,發揮其參考指引價值。
不同的公司、團隊獲取數據、提煉用戶特徵方式均有所不同,大的公司會自建數據分析系統以及有強大的用研和數據分析團隊支撐,而稍小一些的公司更多借力於第三方平台提取數據或開展細分用戶群的用戶調研工作。
1、 用戶畫像一定要建立在真實的數據源基礎上,否則可能會導致產品、運營的一系列方向決策錯誤;
2、團隊成員對用戶畫像的認知和認同不容小覷,應該在項目的不同階段都盡量讓團隊成員參與進來;
3、用戶畫像具有時效性,必須階段性地更新修正,定期更新數據分析時間周期和方向維度,以及時了解市場和用戶的變化趨勢,保持用戶畫像的市場適用性。
4、不要神化用戶畫像的作用和意義,甚至許多公司產品對這塊的研究還是缺失的。正確合理的用戶畫像可以更好地促進公司產品發展以及更好地輔助產品方向決策。
參考素材:
1、易觀智庫:大數據下的用戶分析及用戶畫像
2、邱勝昌老師慕課網:電商大數據應用之用戶畫像
3、楊步濤:基於用戶畫像的大數據挖掘實踐
⑷ 電商平台的用戶畫像標簽體系建設
電商平台連接了賣家和買家兩端,最終目的都是促進交易,從而追求更高的銷售額。提高人貨匹配度是促進交易的關鍵,而提高人貨匹配度的關鍵就是「讓買家找到想要的貨物」。
本文結合「人、貨、場」理論模型,嘗試建立電商平台的用戶畫像標簽體系。
用戶在平台購物的整體流程可以概括為:進入平台、選擇商品、下單付款。
可以將該過程抽象為「人、貨、場」。
即用戶通過什麼途徑進入什麼商品的頁面,完成選擇並下單付款。
人對應用戶特徵、貨對應商品特徵、場對應渠道特徵。
用戶特徵可以從用戶的基礎信息、親屬關系、位置信息、社會特徵、消費特徵五大維度來構建,這五大維度表明了該用戶是一個怎麼樣的人。
商品特徵可以從類目偏好和類目行為人群兩個維度來構建。
1、類目偏好
類目偏好標簽的定義為:用戶在平台上偏好的商品種類。
2、類目行為人群
類目行為人群標簽的定義為:用戶在平台的指定商品類目和時間周期的互動行為。通俗一點就是用戶對商品做了什麼。
類目行為人群有3個要素:具體類目、行為類型、時間范圍。
行為類型一共有5種,分別是搜索,點擊,收藏,加購,購買。
時間范圍一共有5個選項,分別是最近7天、最近15天、最近30天、最近90天、最近180天。
類目行為人群標簽圈到的人群都是在指定時間范圍內,對指定類目有指定行為的人群。
渠道是指用戶接觸到商品詳細頁面的途徑,分為活動渠道和內容渠道。通過渠道特徵可以圈定偏好某種內容形式和內容渠道的人群,以便讓商品針對性地出現在這個位置。
通過「人、貨、場」理論搭建起用戶畫像的標簽體系
⑸ 電商用戶畫像建模
用戶畫像:通過演算法聚合成一類實現用戶信息標簽化。
—確定的標簽:比如用戶購買了或者收藏了某個商品等
—猜測的標簽:比如用戶的性別,是男性的概率0.8,另外還有很多模型:孕婦模型,潛在汽車用戶模型,用戶價值模型
比如:用戶活躍度(活躍,沉睡,流失,未購買)
用戶分群:電腦達人,數碼潮人,家庭用戶,網購達人,奶爸奶媽,單身貴族,閃購用戶,時尚男女等
--根據用戶消費的情況來提取的客戶標簽,用以了解用戶的消費情況,消費習慣
客戶消費訂單表標簽:
購買信息:客戶ID,第一次消費時間,最近一次消費時間,首單距今時間,尾單距今時間,近30/60/90天購買次數/購買金額(不含退拒),最大/最小消費金額,累計消費次數/金額(不含退拒)
累計使用代金券金額,客單價(含退拒),常用收貨地區,常用支付方式,退貨商品數量,退貨商品金額,拒收商品金額/數量,最近一次退貨時間,各地點下單總數/總額,上下午下單總數/總額
購物車信息:最近30天購物車商品件數/提交商品件數/購物車成功率/購物車放棄件數
提取標簽的作用:
確定用戶什麼時候來的,多久沒來了:第一次消費時間,最近一次消費時間,首單距今時間,尾單距今時間
最近消費能力:近30天購買次數(不含退拒),近30購買金額(不含退拒),近30天購買次數(含退拒),近30天購買金額(含退拒)
總體的消費情況:最小/大消費金額(可做個性化商品推薦),累計消費次數(不含退拒,可以計算客單價),累計消費金額,累計使用代金券金額(代金券愛好)
消費屬性:常用收貨地區,常用支付方式
購物車習慣:最近30天購物車次數,最近30天購物車提交商品件數,最近30天購物車商品件數,最近30天購物車放棄件數,最近30天購物車成功率
退貨和習慣特徵:退貨商品數量,拒收商品數量,退貨商品金額,拒收商品金額,最近一次退貨時間
用戶購物時間及地點習慣:各下單地點總數,各時間段下單總數
—根據客戶購買類目的情況提取的客戶標簽,用以了解類目的購買人群情況
客戶購買表標簽:
客戶ID,一級/二級/三級分類ID/名稱,近30天/90天/180天購買類目次數/金額,累計購買類目次數/金額,累計購買類目次數/金額,近30天/90天/180天購物車某類目次數/金額,累計購買類目次數/金額,累計購物車類目次數/金額,最後一次購買類目時間/距今天數
--根據客戶購買商店的情況提取的客戶標簽,用以了解商店及品牌的購買人群(做品牌營銷等)
客戶購買 商店表標簽:
用戶ID,商店ID/名稱,品牌ID/名稱,最近30天購物車次數/商品件數/提交商品件數/成功率/放棄件數,最後一次購物車時間,最近90天商品排除退拒商品件數/金額,最近90天貨到付款訂單數,最近90天退換件數/金額,最近90天拒收件數/金額.
用戶購物模型:
用戶忠誠度模型:
—將用戶營銷相關的常用標簽放到一張表中,方便使用
客戶營銷信息表:
客戶ID,營銷手機號,第一個有效訂單來源/地址/手機號,常用的手機號,常用的收貨地址,不同收貨地址的數量,客戶分群,活躍狀態,用戶價值(重要,保持,流失等),糾結商品,糾結小時
主要來源表:
用戶表,訂單表,活動表,購物車表,客戶品類分群模型,用戶價值模型
客戶活躍狀態模型:
用戶價值模型
--根據客戶參與活動的情況提取的客戶標簽,用於了解用戶對活動的參與情況,以進行活動的策劃
客戶活動信息表內容標簽:
客戶ID,用戶促銷明個度,滿減促銷敏感度,打折促銷敏感度,換購促銷敏感度,滿贈促銷敏感度,購買力分段,品牌偏好,品類偏好,顏色偏好,敗家偏好,沖動偏好,累計積分,已用積分,可以積分,累計代金券數量/金額,已用代金券數量/金額,過期代金券數量/金額,可用代金券數量/金額
標簽作用:
確定用戶喜歡那種活動類型:用戶促銷敏感度,滿減促銷敏感度,滿贈敏感度,打折促銷敏感度,換購促銷敏感度,團購促銷敏感度等
促銷敏感度模型:
--根據用戶購買的活動類型訂單數與金額數已判斷其屬於哪類人群
用戶有什麼偏好:店鋪偏好,品牌偏好,品類偏好,顏色偏好
用戶指數:購買力分段,敗家指數,沖動指數
用戶購買力高中低模型:
—從購物車,客單價來判斷
用戶購買力高中低端模型:
指數模型:
--根據客戶訪問的情況提取的客戶標簽以了解訪問習慣
客戶訪問信息標簽:
最近一次/第一次pc端訪問日期/session/cookies/pv/使用瀏覽器/操作系統/,最近一次/ 第一次app端訪問日期/操作系統,最近一次/第一次訪問ip/訪問城市/省份,近7天/15天/30天/60天/90天app端/pc端訪問次數,近30天pc端/app端訪問天數/訪問並購買次數/訪問pv/訪問評價pv/ip數/,app及pc端各時間段訪問的次數
該文章來自邱盛昌老師的慕課視頻筆記:
鏈接: http://www.imooc.com/learn/460/
⑹ python是什麼意思
Python是一種解釋型、面向對象、動態數據類型的高級程序設計語言。python是一個高層次的結合了解釋性、編譯性、互動性和面向對象的腳本語言。最初被設計用於編寫自動化腳本(shell),隨著版本的不斷更新和語言新功能的添加,越多被用於獨立的、大型項目的開發。
Python由Guido van Rossum於1989年底發明,第一個公開發行版發行於1991年。像Perl語言一樣,Python 源代碼同樣遵循 GPL(GNU General Public License)協議。
簡介:
Python由荷蘭數學和計算機科學研究學會的Guido van Rossum於1990 年代初設計,作為一門叫做ABC語言的替代品。Python提供了高效的高級數據結構,還能簡單有效地面向對象編程。
Python語法和動態類型,以及解釋型語言的本質,使它成為多數平台上寫腳本和快速開發應用的編程語言,隨著版本的不斷更新和語言新功能的添加,逐漸被用於獨立的、大型項目的開發。
⑺ 項目三、電商用戶畫像分析(上)
電商用戶畫像分析: 用戶畫像是通過分析用戶的基礎信息、特徵偏好、社會屬性等各維度的數據,刻畫出用戶的信息全貌,它是建立在一系列屬性數據之上的目標用戶模型。用戶畫像的本質是一個用以描述用戶需求的工具。用戶畫像一般是產品設計、運營人員從用戶群體中抽象出來的典型用戶,從中可以挖掘用戶價值,提供個性化推薦、精準營銷等服務。
電商用戶畫像分析的作用:
1.導入使用的包:
2.導入數據:
3.理解數據:
order_data共有五個欄位,分別為,其中behavior_type中1為瀏覽,2為收藏,3為加購,4為購買
1.缺失值處理:
1、用戶活躍的時間
1.1 用瀏覽活躍時間段
1.2 用戶購買活躍時間段
1.3 清除緩存:
2、關於類目的用戶行為
2.1 瀏覽最多的類目
2.2 收藏最多的類目
2.3 加購最多的類目
2.4 購買最多的類目
3.2 近30天加購次數
3.3 近30天活躍天數
4、7天用戶行為
4.2 近7天加購次數
4.3 近7天活躍次數
5.最後一次行為距今天數(今天取2014/12/18)
5.1 上次瀏覽距今天數
5.2 上次加購距今天數
5.3 上次購買距今天數
6.最近兩次購買間隔天數
7.是否有商品瀏覽未下單
8.是否有商品加購未下單
9、用戶屬性標簽
9.1 是否復購用戶
9.2 訪問活躍度
總體上看,訪問天數多的訪客比訪問天數少的訪客數量多,且以20次左右為拐點,因此定義訪問天數小於20次的為低活躍,訪問天數大於等於20次的定義為高活躍。
9.3 購買的品類是否單一
9.4 用戶價值分組
可以看出大於8天為低
⑻ 數據分析網站源碼戶畫像行嗎
行。從1991年發明了萬維網開始,到20年後2011年,互聯網真正走向了一個新的里程碑,進入了大數據時代。伴隨著對人的了解逐步深入,一個概念悄然而生:用戶畫像,完美地抽象出一個用戶的信息全貌,可以看作企業應用大數據的根基。眾所周知數據分析的時候,想要得到有價值的結論,需要掌握好的分析方法。數據分析方法有很多,用戶畫像分析就是常用的方法之一,數據分析網站源用戶畫像分析是可行得,用戶畫像基於自動標簽系統將用戶完整的畫像描繪清晰,更有力的支撐運營決策。
⑼ 史上最全用戶畫像分析,附帶案例講解
對於互聯網從業者,經常會提到一個詞——用戶畫像。作為一名剛主要做用戶畫像DMP的數據PM,工作中總是會被需求方問到——
我要查看XXX的用戶畫像 或是 能否能夠XXXX類用戶的畫像。 抑或是有別的產品會問到:你們是怎麼做用戶畫像的?
然而在溝通的過程中,我發現,不同的人對用戶畫像的理解差異還是非常大的。有的人認為用戶畫像就是包含了用戶的詳細的信息,有的人認為用戶畫像是能夠反映出一個群體的統計學特性,有的人認為用戶畫像可以做用戶研究.....這些想法或多或少有一些片面的,本文就用戶畫像的基礎知識進行說明,並結合一些DMP產品進行分析,同時對用戶畫像在K12產品中的應用做一說明。
1、當我們談論DMP和用戶畫像時,我們在談論什麼?
此部分結合常見DMP&用戶畫像定義和我工作中對DMP&用戶畫像的定義進行說明
用戶畫像是DMP中非常重要的一個環節,因此將DMP和用戶畫像拆開進行說明
1.1DMP
1.1.1 DMP是什麼?
DMP即 datamanagement system,數據管理平台,單從名稱上來看,這個定義還是非常寬泛的,所以國內很多企業或者個人會將dmp的核心功能理解錯。
結合我的理解,DMP其實是一個全面的數據收集,加工,整合的平台,吸收各種數據源的數據,以用戶為基本單位,清洗,整理形成結構化的數據表,並進行用戶標簽的計算,以期能夠精準的描述各種用戶。
純碎的DMP平台是指小型的、定製能力極強、中立性好的DMP技術服務商。美國DMP市場是極度細分的,中國市場是高整合的,往往DMP的需求是和DSP、SSP緊密聯系在一起的,目前還很難有純粹的DMP平台。
1.1.2 DMP可以做什麼
精準營銷,廣告投放,個性化推薦,其他應用
1.1.3 DMP的基礎架構及數據加工流程
DMP的基礎架構:
DMP的數據加工流程:
1.1.5 DMP的實際應用(市面上能夠看到的產品)
DMP廣告平台:騰訊廣點通、阿里媽媽達摩盤;
獨立第三方DMP:talkingdata、神策數據;
個性化推薦:今日頭條、一點資訊、淘寶、京東等;
說明:個性化推薦的應用我們能夠感受到,但是背後的邏輯我們是看不到的
其他應用
1.2用戶畫像
1.2.1 用戶畫像是什麼
關於用戶畫像,有兩類定義:User Persona 和User Profile
User Persona:是產品設計、運營人員從用戶群體中抽象出來的典型用戶。例如,在用戶調研階段,產品經理經過調查問卷、客戶訪談了解用戶的共性與差異,匯總成不同的虛擬用戶;
經典案例——《用戶體驗要素》中提到的用戶畫像
UserProfile:根據每個人在產品中的用戶行為數據,產出描述用戶的標簽的集合。例如猜測這個用戶是男是女,生活工作所在地,喜歡哪個明星,要買什麼東西等。
本文所提到的用戶畫像,指的是User Profile
1.2.2 用戶畫像怎麼做
基礎數據收集:收集用戶在網站內外的靜態數據和動態數據;
行為建模:基於用戶的基礎數據,通過技術手段進行行為建模;
構建畫像:通過行為建模,可以輸出一系列的用戶標簽,每個用戶的標簽都可以形成一個集合,這個標簽的集合可以表示出這個用戶的特點。
1.2.3 用戶畫像的常見應用
個性化推薦(電商、資訊類產品)、風控、預測等
1.2.4 用戶畫像與DMP的關系
DMP是數據管理平台,可以簡單理解為,把數據提供到DMP平台,DMP平台輸出一系列標簽,或其他想要的結果。
用戶畫像是輸入用戶數據到DMP,DMP輸出了用戶標簽。
DMP不只可以輸出用戶標簽,也可以輸出其他的標簽,比如輸入文章,輸出文章標簽。
因此,用戶畫像是DMP的一個應用方向。
2 相關產品介紹
由於用戶畫像主要是作為底層應用,因此它的很多應用都是能感知,但不可見。比如電商平台的個性化推薦頁面,資訊類App首頁的個性化推薦背後,就是用戶畫像在發揮著作用,用戶標簽和內容標簽/商品標簽進行智能組合。
由於本人從事K12教育行業,所以只選取了兩類競品:開放DMP平台、教育類產品,其中以開放DMP平台為主。
3 競品分析
3.1 開放DMP平台
3.1.1 產品說明
3.1.2 功能對比
達摩盤
廣點通
神策數據
說明:神策數據看起來更像是一個數據分析工具,但是其底層的搭建、對數據的管理與DMP有類似的地方,並且我們可見的部分即類似BI的功能,可看作DMP在應用層的表現,因此也把它列為競品
3.1.3界面對比
說明:由於這三個產品均需付費才可體驗全部產品功能,界面主要來自於說明文檔,可能與真實節面有一定出入
達摩盤-標簽
達摩盤-新建標簽
達摩盤-人群報表
達摩盤-人群明細
達摩盤-整體報表
廣點通操作界面
廣點通-創建廣告
廣點通-創建廣告2
神策數據-用戶分析-事件分析
神策數據-用戶分析-用戶屬性
3.1.4產品底層技術架構思考對比
說明:
1)此部分內容為通過產品體驗和閱讀說明文檔,思考抽象出可能的底層架構,並非真實情況;
2)產品底層技術架構:我們所看到的功能模塊,都是由不同的技術模塊相互協作實現的。產品底層技術架構描述了產品對應的底層技術模塊、以及模塊之間的關系。
達摩盤
神策數據
3.1.5總結
總結來看,達摩盤和廣點通是DMP在互聯網廣告中的典型應用。DMP是定向廣告投放最核心的大腦,DMP提供的用戶畫像,是進行定向廣告投放的最核心最關鍵的一步。達摩盤和廣點通最重要的目標是,把對的廣告在對的時機,展示給對的人。
而對於神策數據,這一類數據分析工具,DMP在數據分析、數據可視化的過程中也發揮著非常重要的作用,哪類用戶的哪類行為比較突出,哪類用戶在未來會產生什麼樣的行為。
3.2教育類產品
用戶畫像DMP在教育類產品中的應用——
(1) 洋蔥數據個性化課程制定(類似自適應學習);
用戶在學習前,先進行測試,根據測試情況為用戶制定個性化課程包,如下圖1;
圖1
用戶完成學習,根據用戶學習測試結果,展示可視化學習分析報告,如下圖2
圖2
4 用戶畫像怎麼用?
用戶畫像是一個的底層產品,用戶畫像的應用通常難以看到。那麼,用戶畫像該怎麼用呢?結合對DMP產品和教育類產品的分析,用戶畫像的應用總結如下:
(1)用戶標簽可視化——
相關產品的功能:廣點通和達摩盤將用戶標簽直接展示出來,用戶可直接選擇標簽,並且對標簽進行組合,選出目標用戶,然後投放廣告。
可借鑒場景舉例:比如說,我想對今年剛報課程並且消費能力比較高且學習認真的這批學員發送一條推送消息,希望他們能夠參加一場直播,促進其對知識的掌握。那麼可以直接選中:新用戶+消費能力高+學習認真這幾個標簽,然後對這部分用戶發送簡訊。
好處:精細化運營,提高ROI;簡化操作
(2)用戶標簽關聯分析:
相關產品功能-廣點通lookalike:(1)提供種子用戶;(2)篩選種子用戶特徵;(3)將種子用戶與騰訊用戶進行匹配,進行人群擴展
可借鑒場景:一批用戶購買了商品A,我想要找出與購買這一商品相似度比較高的用戶。那麼可以將這批用戶的信息導入到DMP,計算出這批用戶的標簽,再通過關聯分析,找到和這批用戶相似度比較高的用戶
(3)個性化推薦:
相關產品功能:個性化課程制定
可借鑒場景(以K12教育為例):
(1)針對未注冊用戶,根據其訪問行為,為其推薦個性化課程頁面,提高購買轉化率;如果是通過互聯網廣告進來的用戶,則可以為其制定個性化落地頁,提高注冊和購買轉化;
(2)針對注冊未購課,根據其瀏覽行為,為其推薦個性化課程頁面,提高購課率;
(3)根據用戶學習行為(主要是做題情況),為其制定個性化試題和學習建議。
⑽ 數據分析項目——電商平台用戶畫像分析
包括用戶行為數據和用戶基本信息數據:
重復值處理
缺失值處理
數據格式處理:
日期格式的轉換 astype()
查看有無重復值:首先看使用df.info查看各個欄位的記錄數,再看去除重復值後的數量。以此判斷有無重復數據。
去重重復值可以使用函數drop_plicates()
通過df.info查看數據格式
看到time是object類型的,不適合處理。同時我們一般將數據分為日期和時間格式,因此對其進行拆分處理。
為各個時段打標,將時段分為'凌晨'、'上午'、'中午'、'下午'、'晚上'
知識點:pd.cut函數,區間分割
查看空值,並計算數量。可以看到並無空值。
在訂單表中按照(用戶,時段)分組,取每個時段的記錄數(訂單數):
這里的操作流程與hive-sql類似,我們需要先把max算出來,再去關聯。
將生成的標簽加入標簽表:
同理,可統計出用戶購買的活躍時間段,在此不贅述,僅展示結果
分析用戶最喜歡的類目,從而便於我們為其進行推薦。
最終得到標簽表:
通過分析用戶分析最近的行為,來判斷該用戶是否活躍、流失
分析近30天的活躍天數,只要有瀏覽、收藏、加購和購物四種行為之一就認為是活躍。
結果如下:
我們可以通過查看所有用戶30天活躍天數的分布情況,來確認一個分類的標准,判斷某個用戶是否活躍。
用戶30天活躍天數分布圖如圖:
同理,可分析用戶近7天的行為,包括其購物次數和活躍天數。
與上述操作類似,展示結果:
明確今天的日期,在本項目中,「今天」指「2014-12-19」,然後統計訂單表中用戶某種行為的最大日期與當前日期的差值。
使用的函數是:datetime.strptime: new datetime parsed from a string (like time.strptime()) ,將字元串轉為date格式,以方便我們做日期運算
結果如圖:
使用日期的diff函數
返回結果
RFM分組是指按照最近一次消費 (Recency)、消費頻率 (Frequency)和消費金額(Monetary)進行分組
最近一次消費,我們按照最後一次購物距今的天數進行分組,同樣是觀看用戶的一個分布情況,然後看如何進行分類。
消費頻率,這里放寬要求,按照用戶的30天活躍天數進行分類
消費金額,本次不涉及金額的統計。
因此,我們可以根據活躍度分類和最近一次消費將用戶劃分為四類:
結果如圖
可以看到在第8天前後,用戶有明顯的分層,因此按照8天對其進行劃分,最後一次消費距今天數小於8天的,認為最近有消費,大於8天的認為最近無消費
返回結果:
通過value_counts查看每個值的出現次數:
上述返回的結果值是:
如果值為空,說明無相應的行為,對瀏覽未購買的數據記錄進行打標
以上的步驟到商品粒度,下面對用戶進行統計,即只要用戶有瀏覽未下單的行為就對其進行打標
返回的結果如圖:
加購未下單同上述步驟
分析平台用戶的年齡、學歷、性別、城市、職業、婚姻情況等,以便於我們去分析我們的典型用戶是什麼。
從上圖可以看出,平台用戶中男性居多,女性較少。
值的分層可以使用pd.cut函數
從年齡分布圖中,可以看出平台的用戶以25歲-40歲的用戶居多。青年人和中老年用戶較少。
返回結果如下圖,從結果中可以看到來自北上廣深的用戶占絕大部分比例。
從婚姻分布情況中可以看到,平台用戶中有超過60%的用戶為已婚。
使用該平台的用戶大部分擁有大學及以上的學歷
使用該平台的用戶大部分為互聯網從業人群
首先查看這一個月的時間跨度用戶每天的購物情況:
從上圖可以看出,該平台每天的下單用戶數比較平穩,有一些周期性因素在其中,可能是每周周中和周末的購物情況不同。同時,注意到12.12這一天購物用戶激增,可能是12.12購物節的因素。
再分析下用戶喜歡在周幾下單,哪個時間下單
從圖中我們可以看到用戶的喜歡的購物時間:周五,晚上9點。上午購物的人數都比較少,主要集中在下午和晚上。
通過用戶的下單情況,我們可以對每周的下單用戶進行分層,將其分為活躍用戶、不活躍用戶和迴流用戶。
最終結果
通過面積圖看一下每周不同類型用戶的比例情況:
復購率:一周內購買多次(>1)的用戶占總用戶的比例
從中可以看到,5周的復購用戶都在50%以上,47周和51周的復購率較低,可能是因為數據不完整的原因。
用戶最喜歡購買的品類?
用戶最多收藏的品類?
從結果可見,用戶最喜歡購買的品類前五名是6344、12189、5232、1863和4370,用戶收藏最多的品類是13230、5894、1863、6513和5027。
轉換率=瀏覽該商品的用戶數/購買該商品的用戶數
最終結果如圖:
查看轉換率的分布情況: