吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何計算用戶的偏好標簽

lviY_AI_shequ ? 來源:未知 ? 作者:李倩 ? 2018-09-04 17:18 ? 次閱讀

一、用戶畫像—計算用戶偏好標簽

下面介紹如何計算用戶的偏好標簽。

在上一篇寫用戶畫像的文章 “用戶畫像—打用戶行為標簽”中,主要講了如何對用戶的每一次操作行為、業務行為進行記錄打上相應的標簽。在這篇博客中,主要講如何對這些明細標簽進行計算以及偏好的產品、內容的類目。

關于用戶標簽權重的計算,在這篇文章里面講過了:

用戶畫像之標簽權重算法

這里再詳細介紹一下:

用戶標簽權重 = 行為類型權重 × 時間衰減 × 用戶行為次數 × TF-IDF計算標簽權重

公式中各參數的釋義如下:

行為類型權重:用戶瀏覽、搜索、收藏、下單、購買等不同行為對用戶而言有著不同的重要性,一般而言操作復雜度越高的行為權重越大。該權重值一般由運營人員或數據分析人員主觀給出;

時間衰減:用戶某些行為受時間影響不斷減弱,行為時間距現在越遠,該行為對用戶當前來說的意義越小;

行為次數:用戶標簽權重按天統計,用戶某天與該標簽產生的行為次數越多,該標簽對用戶的影響越大;

TF-IDF計算標簽權重:每個標簽的對用戶的重要性及該標簽在全體標簽中重要性的乘積得出每個標簽的客觀權重值;

為計算用戶偏好標簽,需要在用戶行為標簽的基礎上計算用戶行為標簽對應的權重值,而后對同類標簽做權重匯總,算出用戶偏好的標簽。關于用戶行為標簽如何打,在這篇博客里面有介紹過了

用戶畫像—打用戶行為標簽

下面介紹如何在用戶行為標簽表的基礎上加工用戶偏好標簽:

1、用戶標簽權重表結構設計

字段定義:

用戶id(user_id):用戶唯一id;

標簽id(tag_id):圖書id;

標簽名稱(tag_name):圖書名稱;

用戶行為次數(cnt):用戶當日產生該標簽的次數,如用戶當日瀏覽一本圖書4次,則記錄4;

行為日期(date_id):產生該條標簽對應日期;

標簽類型(tag_type_id):在本案例中通過與圖書類型表相關聯,取出每本圖書對應的類型,如《鋼鐵是怎么煉成的》對應“名著”;

用戶行為類型(act_type_id):即用戶的購買、瀏覽、評論等操作行為,在本例中通過預設數值1~7來定義用戶對應的行為類型。1:購買行為,2:瀏覽行為,3:評論行為,4:收藏行為,5:取消收藏行為,6:加入購物車行為,7:搜索行為;

2、在用戶行為標簽基礎上加工權重表

加工標簽權重表時,需要根據用戶不同行為對應的權重建立一個權重維表:

向維表中插入數據:

3、對每個用戶偏好的每個標簽加總求權重值,對權重值做倒排序,取top N

二、用戶畫像—數據指標與表結構設計

本段文章介紹一下畫像中需要開發的數據指標與開發過程中表結構的設計。

首先介紹畫像開發的數據指標,畫像開發過程中通用類的指標體系包括用戶屬性類、用戶行為標簽類、用戶活躍時間段類、用戶消費能力類、用戶偏好類等

數據指標體系

用戶屬性指標

用戶屬性指標根據業務數據來源,盡可能全面地描述用戶基礎屬性,這些基礎屬性值是短期內不會有改變的。如年齡、性別、手機號歸屬地、身份證歸屬地等

用戶登錄活躍指標

看用戶近期登錄時間段、登錄時長、登錄頻次、常登陸地等指標

用戶消費能力指標

看用戶的消費金額、消費頻次、最近消費時間。進一步結合用戶登錄活躍情況,可以對用戶做RFM分層。

用戶流失層級

根據用戶的活躍度及消費情況,判斷用戶的流失意向。可及時對有流失趨向的用戶做營銷召回

用戶年齡段劃分

在做營銷活動或站內推送時,可對不同年齡段做針對性運營

用戶行為標簽

記錄用戶在平臺上每一次操作行為,及該次行為所帶來的標簽。后續可根據用戶的行為標簽計算用戶的偏好標簽,做推薦和營銷等活動

表結構設計

對于畫像數據的存儲,除了用戶屬性這種基本上短期不會有變化的數據,其他相關數據的更新頻率一般都比較高,為周更新或日更新

畫像數據更新較為頻繁,通常使用分區來將數據從物理上轉移到離用戶最近的地方。

一般對日期字段進行分區,當然事實上分區是為了優化查詢性能,否則使用數據的用戶也不需要關注這些字段是否分區。

例如說創建一個用戶行為標簽表:

CREATE TABLE userprofile( user_id string, tag_id string, tag_name string, cnt string, act_type_id string, tag_type_id string ) PARTITION BY (date_id string);

分區表改變了Hive對數據的存儲方式,如果沒做分區,創建的這個表目錄為:

hdfs://master_server/user/hive/warehouse/userprofile

創建日期分區后,Hive可以更好地反映分區結構子目錄:

hdfs://master_server/user/hive/warehouse/userprofile/date_id='2018-05-01'

在userprofile表下面,每個日期分區的數據可以存儲截止到當日的全量歷史數據,方便使用者查找。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據分析
    +關注

    關注

    2

    文章

    1461

    瀏覽量

    34166
  • 標簽
    +關注

    關注

    0

    文章

    137

    瀏覽量

    17935

原文標題:用戶畫像—計算用戶偏好標簽及數據指標與表結構設計

文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于偏好不一致熵的偏好決策方法

    不一致程度;然后,根據偏好決策中不同屬性對決策的重要性不同的特點,提出了一種加權的樣本偏好不一致熵,并結合屬性偏好不一致熵在度量屬性重要性方面的能力,給出了一種基于屬性偏好不一致熵的權
    發表于 12-05 11:50 ?0次下載

    基于用戶QoS偏好的WEB服務灰色關聯分析方法

    為方便用戶選擇最優Web服務,利用灰色系統理論對Web服務質量QoS屬性因子進行分析,提出了一種基于用戶QoS偏好的Web服務灰色關聯分析方法??紤]到Web服務QoS的不確定性,該方法使用區間
    發表于 12-05 15:35 ?0次下載

    面向評分數據中用戶偏好發現的隱變量模型構建

    電子商務應用中產生了大量用戶評分數據,而這些數據中富含了用戶觀點和偏好信息,為了能夠從這些數據中準確地推斷出用戶偏好,提出一種面向評分數據中
    發表于 12-06 10:59 ?0次下載
    面向評分數據中<b class='flag-5'>用戶</b><b class='flag-5'>偏好</b>發現的隱變量模型構建

    基于偏好矩陣遺傳算法求解長期車輛合乘問題

    針對長期車輛合乘問題( LTCPP),提出帶有偏好矩陣的遺傳算法(PMGA),將擁有私家車且目的地相同的用戶群體分配到產生總花費最少的合乘小組。首先,建立計算基于全體用戶費用成本的目標
    發表于 12-06 11:15 ?0次下載

    基于用戶偏好的隨機游走模型

    、項目相似度進行計算;其次,將項目進行聚類,通過用戶評分計算用戶對項目類的偏好和不同項目類下的用戶
    發表于 12-08 17:01 ?0次下載
    基于<b class='flag-5'>用戶</b><b class='flag-5'>偏好</b>的隨機游走模型

    基于用戶行為偏好的服務選擇策略

    在云計算模型中,用戶的需求是服務資源預留的主要依據。而現實中,用戶的喜好往往是隨著時間的推移變化的,例如新的云服務出現后,用戶根據自己的體驗,往往會選擇新的云服務。 本文提出
    發表于 12-11 11:18 ?0次下載
    基于<b class='flag-5'>用戶</b>行為<b class='flag-5'>偏好</b>的服務選擇策略

    偏好數據庫中挖掘Ceteris Paribus偏好

    針對傳統的推薦系統需要用戶給出明確的偏好矩陣(U-I矩陣),進而使用自動化技術來獲取用戶偏好的問題,提出了一種從偏好數據庫中挖掘出Agent
    發表于 12-13 15:13 ?0次下載
    從<b class='flag-5'>偏好</b>數據庫中挖掘Ceteris Paribus<b class='flag-5'>偏好</b>

    基于時間衰減協同偏好獲取方法

    針對現有的推薦系統多采用近鄰用戶偏好行為來預測當前用戶偏好,而不考慮用戶偏好會隨著時間的變
    發表于 12-15 16:14 ?0次下載

    基于用戶偏好的協同過濾算法

    基于評分的用戶相似度;其次,依據用戶項目評分和項目類別信息挖掘用戶對項目類別的興趣度以及用戶項目偏好,并以此
    發表于 12-20 10:54 ?0次下載

    基于標簽主題的協同過濾推薦算法研究

    語義主題,從語義層面計算用戶對各資源的偏好概率,將計算出的偏好概率與協同過濾算法計算出的資源相似
    發表于 03-07 13:58 ?0次下載
    基于<b class='flag-5'>標簽</b>主題的協同過濾推薦算法研究

    什么是用戶畫像?用戶畫像的四階段

    用戶畫像的焦點工作就是為用戶打“標簽”,而一個標簽通常是人為規定的高度精煉的特征標識,如年齡、性別、地域、用戶
    的頭像 發表于 09-14 15:39 ?9702次閱讀

    內容中心網絡中基于用戶偏好的協作緩存策略

    針對內容中心網絡( CCN)中節點默認緩存所有經過的內容,未能實現對內容選擇性緩存與最佳放置的問題,提出一種基于用戶偏好的協作緩存策略( CCUP)。首先,考慮用戶對內容類型的喜好和內容流行度作為
    發表于 12-19 15:23 ?4次下載
    內容中心網絡中基于<b class='flag-5'>用戶</b><b class='flag-5'>偏好</b>的協作緩存策略

    一種基于用戶偏好的權重搜索及告警選擇方法

    用戶在現有交互方式下選擇最為嚴重的告警時完全依據其個人偏好,而未考慮處理不同告警所需成本的差異性問題。為此,提出一種基于用戶偏好的權重搜索及告警選擇方法。挖掘
    發表于 04-29 16:26 ?4次下載
    一種基于<b class='flag-5'>用戶</b><b class='flag-5'>偏好</b>的權重搜索及告警選擇方法

    時序地理社交網絡下基于動態偏好的組查詢

    在新生活體驗與社交影響的驅動下,用戶偏好隨時間不斷改變。為彌補現有的地理社交網絡模型往往無法獲取用戶動態偏好的不足,構建了能夠襝測用戶動態偏
    發表于 05-11 16:38 ?11次下載

    可反映用戶偏好的多目標任務調度算法

    UPTSA算法能尋找反映用戶偏好的最優解,并設計梯形遷移率計算模型擴大其搜索鄰域,避免陷人局部最優解實例分析結果表明, UPTSA算法能有效求解云制造環境下的多目標任務調度問題,為用戶
    發表于 05-25 14:05 ?3次下載
    百家乐官网群sun811| 金宝博网址| 博彩百家乐官网的玩法技巧和规则 | 沙龙百家乐官网代理| 金道百家乐官网游戏| 百家乐官网职业赌徒的解密| 战神国际| 百家乐台布兄弟| 百家乐官网推二八杠| 新濠娱乐城| 百家乐存200送200| 百家乐官网二人视频麻将| 大发888快速提现| 百家乐专业赌徒| 玩百家乐官网澳门368娱乐城| 皇冠平台| 威尼斯人娱乐城游戏| 百家乐网络赌博地址| 海立方百家乐官网的玩法技巧和规则 | 海城市| 跨国际百家乐的玩法技巧和规则| 百家乐官网送钱平台| 张家港百家乐官网赌博| 临清市| 大发888官方 df888 gfxzylc8| 顶尖百家乐的玩法技巧和规则 | 奉新县| 斗牛棋牌游戏| 速博百家乐的玩法技巧和规则| 真人百家乐是啥游戏| 迪士尼百家乐官网的玩法技巧和规则| 百家乐官网平台是最好的娱乐城| 宜章县| 足球注册网站| 百家乐最新缆| 三元风水24山水法| 玩百家乐官网有何技巧| 百家乐官网视频连连看| 三门峡市| 丰禾娱乐| 六合彩图片|