基于用戶(hù)畫(huà)像,根據(jù)每個(gè)用戶(hù)使用路徑與個(gè)人偏好推薦內(nèi)容已經(jīng)成為內(nèi)容類(lèi)產(chǎn)品常見(jiàn)的功能模式,也是提升活躍度與轉(zhuǎn)化率最有效的方式之一。
在之前的課程中,我們介紹了用戶(hù)畫(huà)像的定義、標(biāo)簽體系與創(chuàng)建過(guò)程,本期課程則重點(diǎn)介紹幾種不同的推薦模式與優(yōu)缺點(diǎn)。
常見(jiàn)的推薦邏輯
根據(jù)用戶(hù)信息進(jìn)行推薦,用戶(hù)進(jìn)入產(chǎn)品后需要完善個(gè)人信息及選擇興趣標(biāo)簽,系統(tǒng)根據(jù)用戶(hù)的個(gè)人信息(年齡、性別、地域)及所選興趣標(biāo)簽與內(nèi)容匹配,推薦內(nèi)容標(biāo)簽匹配度高的內(nèi)容。
這種推薦模式的優(yōu)點(diǎn)在于技術(shù)門(mén)檻低,由產(chǎn)品經(jīng)理自己設(shè)計(jì)一套推薦規(guī)則就可以實(shí)現(xiàn)。但缺點(diǎn)也很明顯,一方面用戶(hù)會(huì)不停收到相似的內(nèi)容,很難拓展新的關(guān)注點(diǎn),另一方面,內(nèi)容生產(chǎn)商會(huì)根據(jù)推薦機(jī)制針對(duì)性設(shè)置內(nèi)容的標(biāo)簽、關(guān)鍵字等信息,將低質(zhì)量的內(nèi)容推薦給用戶(hù),造成用戶(hù)流失。
基于大數(shù)據(jù)的推薦模式
該模式的核心在于,通過(guò)建立較復(fù)雜用戶(hù)畫(huà)像模型,收集各種途徑收集用戶(hù)行為數(shù)據(jù)。根據(jù)用戶(hù)業(yè)務(wù)數(shù)據(jù)生成用戶(hù)畫(huà)像,計(jì)算用戶(hù)畫(huà)像相似度,對(duì)用戶(hù)畫(huà)像進(jìn)行分組。通過(guò)內(nèi)容標(biāo)簽與用戶(hù)畫(huà)像標(biāo)簽離線(xiàn)計(jì)算推薦內(nèi)容。
該推薦模式主要包含用戶(hù)畫(huà)像建模、用戶(hù)畫(huà)像聚類(lèi)、內(nèi)容標(biāo)簽、內(nèi)容推薦四個(gè)階段。
用戶(hù)畫(huà)像建模
1、分析業(yè)務(wù)模型, 建立標(biāo)簽體系, 確定標(biāo)簽取值范圍
2、分析標(biāo)簽值的數(shù)據(jù)來(lái)源, 按需收集數(shù)據(jù), 計(jì)算標(biāo)簽值
3、存儲(chǔ)用戶(hù)畫(huà)像數(shù)據(jù), 并及時(shí)更更新
用戶(hù)畫(huà)像最終的結(jié)果是往往是?張表,每行為一個(gè)用戶(hù)的用戶(hù)畫(huà)像,存儲(chǔ)了用戶(hù)對(duì)應(yīng)的每個(gè)標(biāo)簽值。
例子:
用戶(hù)畫(huà)像聚類(lèi)
選擇合適的聚類(lèi)算法, 計(jì)算每個(gè)用戶(hù)畫(huà)像的相似度, 為用戶(hù)分組
常見(jiàn)的聚類(lèi)算法:
層次化: 最近鄰方法, 最遠(yuǎn)鄰方法, 組內(nèi)聚類(lèi)法, 組間聚類(lèi)法, Ward聚類(lèi)法, 正?進(jìn)制法, 粗聚類(lèi)算法
劃分式: 圖論算法, K均值算法, 模糊C均值
基于密度和網(wǎng)格: GDILC 算法, SGC算法, GCHL算法, TFCTMO算法, ST-DBSCAN
其它: ACODF
該部分內(nèi)容由算法經(jīng)理主導(dǎo),作為產(chǎn)品經(jīng)理不用參與。
內(nèi)容標(biāo)簽
為了能把內(nèi)容推薦給用戶(hù), 需要為每個(gè)內(nèi)容打上相應(yīng)的標(biāo)簽, 把內(nèi)容標(biāo)簽化。
與用戶(hù)畫(huà)像類(lèi)似, 需要根據(jù)業(yè)務(wù)目標(biāo)來(lái)給內(nèi)容打標(biāo)簽。
內(nèi)容推薦
主要有三種推薦方法。
1、協(xié)同過(guò)濾推薦方法
基于用戶(hù)的協(xié)同過(guò)濾: 用戶(hù)A喜歡A內(nèi)容, 那么跟用戶(hù)A類(lèi)似的用戶(hù)B也喜歡A內(nèi)容
基于內(nèi)容的協(xié)同過(guò)濾: 用戶(hù)A喜歡A內(nèi)容, 那么同樣喜歡A內(nèi)容的用戶(hù)B喜歡的內(nèi)容B?用戶(hù)A也喜歡。
優(yōu)勢(shì):
有效的使?用其它用戶(hù)的反饋信息, 提高準(zhǔn)確度
基于用戶(hù)相似推薦可以發(fā)現(xiàn)?用戶(hù)的潛在興趣, 增加推薦的多樣性
劣勢(shì):
用戶(hù)和物品存在冷啟動(dòng)問(wèn)題, 新?用戶(hù)新內(nèi)容沒(méi)有行為數(shù)據(jù), 所以無(wú)法做出推薦,可解釋性不穩(wěn)定, 因?yàn)椴粚?duì)內(nèi)容做分析, 所以無(wú)法根據(jù)深層特征和修改來(lái)推薦。
相關(guān)算法:
關(guān)系矩陣及矩陣計(jì)算:用戶(hù)關(guān)系 U-U 矩陣、內(nèi)容關(guān)系 V-V 矩陣、用戶(hù)-內(nèi)容 U-V 矩陣
基于記憶的協(xié)同過(guò)濾算法
基于模型的協(xié)同過(guò)濾算法:基于隱因子模型的推薦算法、基于樸素貝葉斯分類(lèi)的推薦算法。
2、基于內(nèi)容的推薦方法:
用戶(hù)喜歡內(nèi)容A , 那么跟內(nèi)容A 類(lèi)似的內(nèi)容B 用戶(hù)也喜歡
優(yōu)勢(shì):
用戶(hù)間相互獨(dú)立獨(dú)立, 只依賴(lài)單人偏好
因?yàn)閮?nèi)容類(lèi)似, 所以推薦的內(nèi)容直觀(guān)上很容易解釋
新內(nèi)容不存在冷啟動(dòng)問(wèn)題, 因?yàn)橹灰獌?nèi)容相似就能被推薦
劣勢(shì):
對(duì)內(nèi)容標(biāo)簽要求高
不利于挖掘用戶(hù)的潛在興趣
存在新用戶(hù)冷啟動(dòng)問(wèn)題
3、基于知識(shí)的推薦方法:
用大量的數(shù)據(jù), 訓(xùn)練專(zhuān)家模型, 用專(zhuān)家來(lái)對(duì)用戶(hù)偏好推薦
混合推薦方法: 根據(jù)業(yè)務(wù)場(chǎng)景, 將以上方法進(jìn)行混合, 優(yōu)化推薦結(jié)果。
并行:
加權(quán)式——對(duì)多個(gè)結(jié)果加權(quán)計(jì)算獲得最終結(jié)果
切換式——根據(jù)場(chǎng)景使用不同的方法
混雜——同時(shí)用以上兩種
串行:
層疊式——基于?個(gè)推薦結(jié)果再做?次推薦
級(jí)聯(lián)式——將?種推薦學(xué)習(xí)到的模型作為另?推薦的輸入
小結(jié)
基于大數(shù)據(jù)的推薦模式,可以有效實(shí)現(xiàn)"千人千面"的推薦模式,為用戶(hù)不斷輸送感興趣的內(nèi)容,并挖掘用戶(hù)潛在興趣點(diǎn)。
對(duì)于沒(méi)有使用的記錄的新用戶(hù),則采用常規(guī)推薦模式,當(dāng)有了記錄后根據(jù)用戶(hù)行為進(jìn)行大數(shù)據(jù)推薦。
具體采用怎樣的推薦模式,則需要產(chǎn)品經(jīng)理根據(jù)產(chǎn)品特性結(jié)合企業(yè)的實(shí)際技術(shù)能力進(jìn)行選擇。
-
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8908瀏覽量
137801
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論