01
寫(xiě)在前面
我們經(jīng)常在淘寶上購(gòu)物, 作為淘寶方,他們肯定想知道他的使用用戶是什么樣的, 是什么樣的年齡性別, 城市, 收入, 他的購(gòu)物品牌偏好, 購(gòu)物類型, 平時(shí)的活躍程度是什么樣的, 這樣的一個(gè)用戶描述就是用戶畫(huà)像分析
無(wú)論是產(chǎn)品策劃還是產(chǎn)品運(yùn)營(yíng), 前者是如何去策劃一個(gè)好的功能, 去獲得用戶最大的可見(jiàn)的價(jià)值以及隱形的價(jià)值, 必須的價(jià)值以及增值的價(jià)值, 那么了解用戶, 去做用戶畫(huà)像分析, 會(huì)成為數(shù)據(jù)分析去幫助產(chǎn)品做做更好的產(chǎn)品設(shè)計(jì)重要的一個(gè)環(huán)節(jié)。
那么作為產(chǎn)品運(yùn)營(yíng), 比如要針用戶的拉新, 挽留, 付費(fèi), 裂變等等的運(yùn)營(yíng), 用戶畫(huà)像分析可以幫助產(chǎn)品運(yùn)營(yíng)去找到他們的潛在的用戶, 從而用各種運(yùn)營(yíng)的手段去觸達(dá)。
因?yàn)楫?dāng)我們知道我們的群體的是什么樣的一群人的時(shí)候, 潛在的用戶也是這樣的類似的一群人,這樣才可以做最精準(zhǔn)的拉新,提高我們的ROI
在真正的工作中, 用戶畫(huà)像分析是一個(gè)重要的數(shù)據(jù)分析手段去幫助產(chǎn)品功能迭代, 幫助產(chǎn)品運(yùn)營(yíng)做用戶增長(zhǎng)。
總的來(lái)說(shuō), 用戶畫(huà)像分析就是基于大量的數(shù)據(jù), 建立用戶的屬性標(biāo)簽體系, 同時(shí)利用這種屬性標(biāo)簽體系去描述用戶
02
用戶畫(huà)像的作用
像上面描述的那樣, 用戶畫(huà)像的作用主要有以下幾個(gè)方面
1.廣告投放
在做用戶增長(zhǎng)的例子中, 我們需要在外部的一些渠道上進(jìn)行廣告投放, 對(duì)可能的潛在用戶進(jìn)行拉新, 比如B站在抖音上投廣告
我們?cè)谶x擇平臺(tái)進(jìn)行投放的時(shí)候, 有了用戶畫(huà)像分析, 我們就可以精準(zhǔn)的進(jìn)行廣告投放, 比如抖音的用戶群體是18-24歲的群體, 那么廣告投放的時(shí)候就可以針對(duì)這部分用戶群體進(jìn)行投放, 提高投放的ROI
假如我們沒(méi)有畫(huà)像分析, 那么可能會(huì)出現(xiàn)投了很多次廣告, 結(jié)果沒(méi)有人點(diǎn)擊
2.精準(zhǔn)營(yíng)銷
假如某個(gè)電商平臺(tái)需要做個(gè)活動(dòng)給不同的層次的用戶發(fā)放不同的券, 那么我們就要利用用戶畫(huà)像對(duì)用戶進(jìn)行劃分, 比如劃分成不同的付費(fèi)的活躍度的用戶, 然后根據(jù)不同的活躍度的用戶發(fā)放不用的優(yōu)惠券。
比如針對(duì)付費(fèi)次數(shù)在[1-10] 的情況下發(fā) 10元優(yōu)惠券刺激, 依次類推
3.個(gè)性化推薦
精確的內(nèi)容分發(fā), 比如我們?cè)谝魳?lè)app 上看到的每日推薦, 網(wǎng)易云之所以推薦這么準(zhǔn), 就是他們?cè)谧鳇c(diǎn)擊率預(yù)估模型(預(yù)測(cè)給你推薦的歌曲你會(huì)不會(huì)點(diǎn)擊)的時(shí)候, 考慮了你的用戶畫(huà)像屬性。
比如根據(jù)你是90后, 喜歡傷感的, 又喜歡杰倫, 就會(huì)推薦類似的歌曲給你, 這些就是基于用戶畫(huà)像推薦
4. 風(fēng)控檢測(cè)
這個(gè)主要是金融或者銀行業(yè)設(shè)計(jì)的比較多, 因?yàn)榻?jīng)常遇到的一個(gè)問(wèn)題就是銀行怎么決定要不要給一個(gè)申請(qǐng)貸款的人給他去放貸
經(jīng)常的解決方法就是搭建一個(gè)風(fēng)控預(yù)測(cè)模型, 去預(yù)約這個(gè)人是否會(huì)不還貸款,同樣的, 模型的背后很依賴用戶畫(huà)像。
用戶的收入水平, 教育水平, 職業(yè), 是否有家庭,是否有房子, 以及過(guò)去的誠(chéng)信記錄, 這些的畫(huà)像數(shù)據(jù)都是模型預(yù)測(cè)是否準(zhǔn)確的重要數(shù)據(jù)
5. 產(chǎn)品設(shè)計(jì)
互聯(lián)網(wǎng)的產(chǎn)品價(jià)值 離不開(kāi) 用戶 需求 場(chǎng)景 這三大元素, 所以我們?cè)谧霎a(chǎn)品設(shè)計(jì)的時(shí)候, 我們得知道我們的用戶到底是怎么樣的一群人, 他們的具體情況是什么, 他們有什么特別的需求, 這樣我們才可以設(shè)計(jì)出對(duì)應(yīng)解決他們需求痛點(diǎn)的產(chǎn)品功能
在產(chǎn)品功能迭代的時(shí)候, 我們需要分析用戶畫(huà)像行為數(shù)據(jù), 去發(fā)現(xiàn)用戶的操作流失情況, 最典型的一種場(chǎng)景就是漏斗轉(zhuǎn)化情況, 就是基于用戶的行為數(shù)據(jù)去發(fā)現(xiàn)流失嚴(yán)重的頁(yè)面, 從而相對(duì)應(yīng)的去優(yōu)化對(duì)應(yīng)的頁(yè)面,
比如我們發(fā)現(xiàn)從下載到點(diǎn)擊付款轉(zhuǎn)化率特別低,那么有可能就是我們付款的按鈕的做的有問(wèn)題, 就可以針對(duì)性的優(yōu)化按鈕的位置等等
同時(shí)也可以分析這部分轉(zhuǎn)化率主要是在那部分用戶群體中低, 假如發(fā)現(xiàn)高齡的用戶的轉(zhuǎn)化率要比中青年的轉(zhuǎn)化率低很多, 那有可能是因?yàn)槲覀冏煮w的設(shè)置以及按鈕本身位置不顯眼等等, 還有操作起來(lái)不方便等等因素
6. 數(shù)據(jù)分析
在做描述性的數(shù)據(jù)分析的時(shí)候, 經(jīng)常需要畫(huà)像的數(shù)據(jù), 比如描述抖音的美食博主是怎么樣的一群人, 他們的觀看的情況, 他們的關(guān)注其他博主的情況等等
簡(jiǎn)單來(lái)說(shuō)就是去做用戶刻畫(huà)的時(shí)候, 用戶畫(huà)像可以幫助數(shù)據(jù)分析刻畫(huà)用戶更加清晰。
03
如何搭建用戶畫(huà)像
用戶畫(huà)像搭建的架構(gòu)如下:
數(shù)據(jù)層:
首先 是數(shù)據(jù)層, 用戶畫(huà)像的基礎(chǔ)是首先要去獲取完整的數(shù)據(jù), 互聯(lián)網(wǎng)的數(shù)據(jù)主要是利用打點(diǎn), 也就是大家說(shuō)的數(shù)據(jù)埋點(diǎn)上報(bào)上來(lái)的, 整個(gè)過(guò)程就是數(shù)據(jù)分析師會(huì)根據(jù)業(yè)務(wù)需要提數(shù)據(jù)上報(bào)的需求,然后由開(kāi)發(fā)完成, 這樣就有了上報(bào)的數(shù)據(jù)。
除了上報(bào)的數(shù)據(jù), 還有其他數(shù)據(jù)庫(kù)同步的數(shù)據(jù), 一般會(huì)把數(shù)據(jù)庫(kù)的數(shù)據(jù)同步到hive表中, 按照數(shù)據(jù)倉(cāng)庫(kù)的規(guī)范,按照一個(gè)個(gè)主題來(lái)放置
還有一些其他的數(shù)據(jù)比如外部的一些調(diào)研的數(shù)據(jù), 以excel 格式存在, 就需要把excel 數(shù)據(jù)導(dǎo)入到hive 表中
挖掘?qū)?
有了基礎(chǔ)的數(shù)據(jù)以后, 就進(jìn)入到挖掘?qū)? 這個(gè)層次主要是兩件事情, 一個(gè)是數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)建, 一個(gè)是標(biāo)簽的預(yù)測(cè), 前者是后者的基礎(chǔ)。
一般來(lái)說(shuō)我們會(huì)根據(jù)數(shù)據(jù)層的數(shù)據(jù)表, 對(duì)這些數(shù)據(jù)表的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,數(shù)據(jù)計(jì)算匯總,然后按照數(shù)據(jù)倉(cāng)庫(kù)的分層思想, 比如按照 數(shù)據(jù)原始層, 數(shù)據(jù)清洗層,數(shù)據(jù)匯總層, 數(shù)據(jù)應(yīng)用層等等進(jìn)行表的設(shè)計(jì)
數(shù)據(jù)原始層的表的數(shù)據(jù)就是上報(bào)上來(lái)的數(shù)據(jù)入庫(kù)的數(shù)據(jù),這一層的數(shù)據(jù)沒(méi)有經(jīng)過(guò)數(shù)據(jù)清洗處理, 是最外層的用戶明細(xì)數(shù)據(jù)
數(shù)據(jù)清洗層主要是數(shù)據(jù)原始層的數(shù)據(jù)經(jīng)過(guò)簡(jiǎn)單數(shù)據(jù)清洗之后的數(shù)據(jù)層, 主要是去除明顯是臟數(shù)據(jù), 比如年齡大于200歲, 地域來(lái)自 FFFF的等明顯異常數(shù)據(jù)
數(shù)據(jù)匯總層的數(shù)據(jù)主要是根據(jù)數(shù)據(jù)分析的需求, 針對(duì)想要的業(yè)務(wù)指標(biāo), 比如用戶一天的聽(tīng)歌時(shí)長(zhǎng), 聽(tīng)歌歌曲數(shù), 聽(tīng)的歌手?jǐn)?shù)目等等, 就可以按照用戶的維度, 把他的行為進(jìn)行聚合, 得到用戶的輕量指標(biāo)的聚合的表。
這個(gè)層的用處主要是可以快速求出比如一天的聽(tīng)歌總數(shù), 聽(tīng)歌總時(shí)長(zhǎng), 聽(tīng)歌時(shí)長(zhǎng)高于1小時(shí)的用戶數(shù), 收藏歌曲數(shù)高于100 的用戶數(shù)是多少等等的計(jì)算就可以從這個(gè)層的表出來(lái)
數(shù)據(jù)應(yīng)用層主要是面向業(yè)務(wù)方的需求進(jìn)行加工,可能是在數(shù)據(jù)匯總的基礎(chǔ)上加工成對(duì)應(yīng)的報(bào)表的指標(biāo)需求, 比如每天聽(tīng)歌的人數(shù), 次數(shù), 時(shí)長(zhǎng),搜索的人數(shù), 次數(shù), 歌曲數(shù)等等
按照規(guī)范的數(shù)據(jù)倉(cāng)庫(kù)把表都設(shè)計(jì)完成后, 我們就得到一部分的用戶的年齡性別地域的基礎(chǔ)屬性的數(shù)據(jù)以及用戶觀看付費(fèi) 活躍等等行為的數(shù)據(jù)
但是有一些用戶的數(shù)據(jù)是拿不到的比如音樂(lè)app 為例, 我們一般是拿不到用戶的聽(tīng)歌偏好這個(gè)屬性的數(shù)據(jù), 我們就要通過(guò)機(jī)器學(xué)習(xí)的模型對(duì)用戶的偏好進(jìn)行預(yù)測(cè)
機(jī)器學(xué)習(xí)的模型預(yù)測(cè)都是基于前面我們構(gòu)建的數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)的, 因?yàn)橹挥型暾臄?shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù), 是模型特征構(gòu)建的基礎(chǔ)
服務(wù)層:
有了數(shù)據(jù)層和挖掘?qū)右院? 我們基本對(duì)用戶畫(huà)像體系構(gòu)建的差不多, 那么就到了用戶畫(huà)像賦能的階段。
最基礎(chǔ)的應(yīng)用就是利用用戶畫(huà)像寬表的數(shù)據(jù),對(duì)用戶的行為進(jìn)行洞察歸因 挖掘行為和屬性特征上的規(guī)律
另外比較大型的應(yīng)用就是搭建用戶畫(huà)像的平臺(tái), 背后就是用戶畫(huà)像表的集成。
用戶提取:我們可以利用用戶畫(huà)像平臺(tái), 進(jìn)行快速的用戶選取, 比如抽取18-24歲的女性群體 聽(tīng)過(guò)杰倫歌曲的用戶, 我們就可以快速的抽取。
分群對(duì)比:我們可以利用畫(huà)像平臺(tái)進(jìn)行分群對(duì)比。比如我們想要比較音樂(lè)vip 的用戶和非vip 的用戶他們?cè)谛袨榛钴S和年齡性別地域 注冊(cè)時(shí)間, 聽(tīng)歌偏好上的差異, 我們就可以利用這個(gè)平臺(tái)來(lái)完成
功能畫(huà)像分析:我們還可以利用用戶畫(huà)像平臺(tái)進(jìn)行快速進(jìn)行某個(gè)功能的用戶畫(huà)像描述分析, 比如音樂(lè)app 的每日推薦功能, 我們想要知道使用每日推薦的用戶是怎么樣的用戶群體,以及使用每日推薦不同時(shí)長(zhǎng)的用戶他們的用戶特征分別都是怎么樣的,就可以快速的進(jìn)行分析
責(zé)任編輯:lq
-
模型
+關(guān)注
關(guān)注
1文章
3313瀏覽量
49233 -
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1461瀏覽量
34168 -
用戶畫(huà)像
+關(guān)注
關(guān)注
0文章
7瀏覽量
2428
原文標(biāo)題:數(shù)據(jù)分析思維和方法—用戶畫(huà)像分析
文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開(kāi)發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
七款經(jīng)久不衰的數(shù)據(jù)可視化工具!
數(shù)據(jù)網(wǎng)絡(luò)分析儀的原理和應(yīng)用場(chǎng)景
ads1115將ADDR線接地數(shù)據(jù)就是255,ADDR浮空數(shù)據(jù)就是65535不變,問(wèn)題出在哪里?
NVIDIA助力百度提升數(shù)據(jù)分析效能
IP風(fēng)險(xiǎn)畫(huà)像詳細(xì)接入規(guī)范、API參數(shù)(Ipdatacloud)
![IP風(fēng)險(xiǎn)<b class='flag-5'>畫(huà)像</b>詳細(xì)接入規(guī)范、API參數(shù)(Ipdatacloud)](https://file1.elecfans.com/web1/M00/F5/23/wKgaoWc2u6eAAnOHABM2W9_2oFk718.png)
SUMIF函數(shù)在數(shù)據(jù)分析中的應(yīng)用
物聯(lián)網(wǎng)的數(shù)據(jù)分析方法
云計(jì)算在大數(shù)據(jù)分析中的應(yīng)用
AI大模型的訓(xùn)練數(shù)據(jù)來(lái)源分析
IP 地址大數(shù)據(jù)分析如何進(jìn)行網(wǎng)絡(luò)優(yōu)化?
![IP 地址大<b class='flag-5'>數(shù)據(jù)分析</b>如何進(jìn)行網(wǎng)絡(luò)優(yōu)化?](https://file1.elecfans.com/web2/M00/09/50/wKgaomb3fYeADdmbAAEuarp64SY280.png)
評(píng)論