吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

奇異值分解和矩陣分解傻傻分不清楚?一文幫你理清兩者差異!

電子工程師 ? 來源:lq ? 2019-05-05 11:26 ? 次閱讀

推薦系統的相關研究中,我們常常用到兩個相關概念:矩陣分解和奇異值分解。這兩個概念是同一種算法嗎?兩者到底有什么差別?在本文中,作者梳理了兩種算法的概念、來源和內容,并進行了比較。通過對相關內容的梳理,作者提出,矩陣分解是推薦系統中最初使用的概念,奇異值分解是對該方法的進一步發展。在現在的討論中,一般將兩種方法統一成為奇異值分解。

在 Andrew Ng 教授的機器學習課程中,介紹推薦系統時經常涉及矩陣分解、奇異值分解等數學知識,這些概念并不是很好理解。在 Andrew Ng 教授的課程提到了一種稱為稱為 (低因子) 矩陣分解的方法,而在 Google 搜索會得到另一個名稱:奇異值分解。網絡資源中對于該算法的解釋和 Andrew Ng 教授存在差異,但很多人都認為這兩個名稱指的是同一種算法。為了更好的梳理這兩個概念,在本文中,我對兩者進行了分別介紹,并對比了它們的不同。

推薦系統

推薦系統 (Recommender Systems, RS) 是一種自動化的針對用戶的內容推薦方式,被廣泛用于電子商務公司,流媒體服務 (streaming services) 和新聞網站等系統。根據用戶的喜好,推薦系統能夠投其所好,為用戶推薦一些合適的內容,以便減少用戶篩選過程中一些不必要的麻煩。

推薦系統并不是一種全新的技術,相關概念最晚在1990年就出現了。事實上,當前的機器學習熱潮,一部分要歸因于人們對 RS 的廣泛關注。 在2006年,Netflix 贊助了一場為電影尋找最佳推薦系統的競賽,在當時引起了一片轟動,也讓推薦系統再次得到了廣泛的關注。

矩陣表示

我們可以有很多種方式來向別人推薦一部電影。其中一種效果較好的策略,是將用戶對電影的評分看做一個用戶 x 電影矩陣,如下所示:

在該矩陣中,問號代表用戶未評分的電影。隨后,只需要以某種方式預測來用戶對電影評分,并向用戶推薦他們可能喜歡的電影。

矩陣分解

在 Netflix 舉辦的比賽上,參賽者 Simon Funk 提出了一個很好的想法,即用戶對電影的評分不是隨給出的。用戶會基于一定的邏輯,針對電影中他所所喜歡的部分 (如特定的女演員或類型) 和不喜歡的情節 (長時間或糟糕的笑話) 賦予不同的權重,并進行加權計算,最后得到一個分數作為該電影的評分。這個過程可以用如下公式表示:

其中 xm 是電影 m 特征值的一個列向量,而 θ? 是另一個列向量,表示用戶 u 賦予每個電影特征的權重。每個用戶都有不同的權重集合,而每個電影的特征也對應不同的特征集合。

事實證明,如果能夠任意地修改特征的數量并忽略所缺失的那部分電影評分,那么就可以找到一組權重和特征值,依據這些值所創建新矩陣與原始的評分矩陣是很接近的。這一過程可以通過梯度下降來實現,且類似于線性回歸中所使用的梯度下降,只不過我們需要同時優化權重和特征這兩組參數。以上文提供的用戶-電影矩陣為例,優化后得到的結果將生成如下新的矩陣:

值得注意的是,在大多數真實數據集中,生成的結果矩陣并不會精確地與原始矩陣保持一致。因為在現實生活中,用戶不會對通過矩陣乘法和求和等操作對電影進行評分。大多數情況下,用戶對電影進行評分只是一種主觀性的行為,且可能受到各種外部因素的影響。盡管如此,這里所介紹的方法還是希望通過數學公式來表達用戶在電影評分時的主要邏輯。

通過上面的計算,現在我們已經得到了一個近似矩陣,那該如何來預測缺失的電影評級呢?通過回顧上面的計算過程,我們可以發現,為了構建這個新矩陣,這里定義了一個公式來填充矩陣中的所有值,包括原始矩陣中的缺失值。因此,如果想要預測缺失的用戶電影評分,這里只需獲取該缺失電影的所有特征值,再乘以該用戶的所有權重并將所有內容相加,就能得到用戶對該電影的評分。因此在這里,如果想要預測用戶2對電影1的評級,可以通過以下計算:

? ? ?

為了簡化表達式,在這里可以對 θ 和 x 進行分離,并將它們放入各自的矩陣(比如 P 和 Q)。

以上就是 Funk 所提出的矩陣分解方法,也是 Andrew Ng 教授在課上所提到的矩陣分解。該方法在當時 Netflix 競賽中獲得第三名,引起了廣泛的關注,并在當前許多應用中仍被使用。

奇異值分解

下面介紹奇異值分解 (Singular Value Decomposition, SVD)。SVD 方法是將一個矩陣分解為三個矩陣的矩陣分解方法,即 A =UΣV?,且三個分解矩陣會具有一些較好的數學特性。

SVD 方法具有廣泛的應用,其中之一就是主成分分析(Principal Component Analysis, PCA) ,該方法能夠將維度 n 的數據集減少到 k 個維度 (k

這里不再展開介紹 SVD 方法的詳細信息。我們只需要記住,奇異值分解與矩陣分解的處理方式不同。使用SVD 方法會得到三個分解矩陣,而 Funk 提出的矩陣分解方式只創建了兩個矩陣。

那為什么在每次搜索推薦系統時總會彈出 SVD 的相關內容呢? Luis Argerich 認為原因在于:

事實上,矩陣分解是推薦系統中首先使用的方法,而 SVD++ 可視為是對它的一種擴展形式。正如 Xavier Amatriain 所說的那樣:

而 Wikipedia 在對矩陣分解(推薦系統)的相關條目中也有類似的表述:

最后,簡單進行一下總結:

奇異值分解(SVD)是一種相對復雜的數學技術,它將矩陣分解為三個新的矩陣,并廣泛應用于當前許多的應用中,包括主成分分析(PCA)和推薦系統(RS)。

Simon Funk 在2006年的 Netflix 競賽中提出并使用了一個非常好的策略,改方法將矩陣分解為兩個權重矩陣,并使用梯度下降來找到特征和權重所對應的的最優值。實質上,這是不同于 SVD 方法的另一種技術,將其稱為矩陣分解更為合適。

隨著這兩種方法的廣泛應用,研究者并沒有嚴謹地在術語上區分這兩種方法,而是統一將其稱為 SVD。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 矩陣
    +關注

    關注

    0

    文章

    425

    瀏覽量

    34644
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    133087
  • 奇異值分解
    +關注

    關注

    0

    文章

    4

    瀏覽量

    6373

原文標題:一文幫你梳理清楚:奇異值分解和矩陣分解 | 技術頭條

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    MATLAB線性方程和特征奇異命令

    逆 特征奇異 Eig 求特征和特征向量 Poly 求特征多項式 Hess Hes***erg形式 Qz 廣義特征 Cdf
    發表于 09-22 16:01

    工業互聯網和工業4.0傻傻分不清楚

    工業互聯網是什么?工業互聯網的網速快嗎?工業互聯網是物聯網概念的重新包裝么?工業互聯網和工業4.0,傻傻分不清楚?工業互聯網已經滲透到了哪些領域?
    發表于 07-12 06:51

    不要再對各種電機、舵機傻傻分不清楚了 精選資料分享

    你是否和木木樣,想要自己diy個機器人,卻對電機、舵機、步進電機、伺服電機、數字舵機、模擬舵機、串行總線舵機……大堆名詞傻傻分不清楚
    發表于 09-01 08:31

    基于改進奇異值分解的人耳識別算法研究

    提出了基于特征矩陣和改進的奇異值分解的人耳識別算法。采用特征矩陣及Fisher最優鑒別分析方法將原始樣本向最優鑒別矢量投影,有效地降低了維數,再進行奇異值分解后所得
    發表于 06-29 08:53 ?18次下載

    采用奇異值分解的數字水印嵌入算法

    提出種新的數字水印嵌入算法,采用奇異值分解(SVD)算法對數據進行分解變換。利用正交矩陣作為容器進行水印嵌入,并通過參數的選擇和糾錯碼的使用提高水印的隱蔽性和魯棒性
    發表于 07-30 14:30 ?29次下載

    基于整體與部分奇異值分解的人臉識別

    針對原有奇異值分解的不足,本文將圖像矩陣進行投影,并對整體與三組局部奇異結合進行改進,再利用BP 神經網絡進行分類識別,對該文提出的方法進行了人臉識別實驗。結
    發表于 01-13 14:36 ?10次下載

    基于奇異值分解的車牌特征提取方法研究

    研究了基于小波分析的車牌圖像定位、分割、大小歸化方法,并分析了奇異值分解算法的數學原理和算法。利用奇異值分解作為代數特征提取方法,獲得圖像的有效特征描述。以Mat
    發表于 10-17 11:08 ?28次下載
    基于<b class='flag-5'>奇異值分解</b>的車牌特征提取方法研究

    基于FPGA的高光譜圖像奇異值分解降維技術

    基于FPGA的高光譜圖像奇異值分解降維技術
    發表于 08-30 15:10 ?2次下載

    科普:石墨烯電池、石墨烯基電池二有何不同?別傻傻分不清

    很多吃瓜群眾是不是已經對“石墨烯電池”和“石墨烯基電池”傻傻分不清楚了。
    發表于 01-23 15:40 ?5427次閱讀

    基于BP神經網絡和局部與整體奇異值分解的人臉識別

    基于BP神經網絡和局部與整體奇異值分解的人臉識別matlab
    發表于 07-29 13:46 ?24次下載

    基于矩陣分解的手機APP推薦

    (包括奇異值分解(SVD)和非負矩陣分解(NMF))的推薦算法、奇異值分解推薦算法以及因子分解機推薦算法進行手機App推薦。實驗表明,因子
    發表于 12-22 16:43 ?0次下載

    芯片、半導體、集成電路還在傻傻分不清楚

    芯片,半導體,集成電路,傻傻分不清楚? 很多人都會有這樣的煩惱,希望今天分享的文章能幫助到大家~起學習!起進步! 、什么是芯片? 芯片
    的頭像 發表于 09-28 17:13 ?3w次閱讀

    基于奇異值分解的時空序列分解模型ST-SVD

    針對傳統時空序列建模過程中估計空間權重矩陣時難度較髙的冋題,提岀種基于奇異值分解(SVD)的時空序列分解模型ST-sSVD。對原始時空序列矩陣
    發表于 03-23 16:39 ?19次下載
    基于<b class='flag-5'>奇異值分解</b>的時空序列<b class='flag-5'>分解</b>模型ST-SVD

    基于奇異值分解和引導濾波的低照度圖像增強

    基于奇異值分解和引導濾波的低照度圖像增強
    發表于 06-18 11:53 ?4次下載

    別再傻傻分不清楚光纖和網線了

    目前網線和光纖就成為了網絡信號傳輸中最重要的種載體,如何選擇你清楚吧?這兩者的區別你了解嗎?下面就看看clan通訊小編的解答吧。
    的頭像 發表于 12-20 09:54 ?6871次閱讀
    中国足球竞彩网| 巴比伦百家乐的玩法技巧和规则 | 大发888网址官方| 新星娱乐城| 百家乐官网技巧-百家乐官网开户指定代理网址 | 百家乐官网奥| 新世纪娱乐| 大集汇百家乐官网的玩法技巧和规则 | 老虎机| 杨公风水24山分金| 棋牌娱乐平台| 百家乐官网真人游戏| 金界百家乐的玩法技巧和规则 | 百家乐官网干洗店| 百家乐有哪些注| 太阳城音乐广场| 网上玩百家乐官网有钱| 西游记百家乐官网娱乐城| 百家乐单机破解版| 凯时百家乐官网技巧| 百家乐如何计牌| 顶级赌场连环夺宝ios下载| 大世界百家乐官网娱乐城| 棋牌百家乐怎么玩| 大发888赌场 游戏平台| 百家乐官网游戏开发软件| 如何玩百家乐的玩法技巧和规则 | 全讯网3532888| 百家乐官网玩法的技巧| 玩百家乐是否有技巧| 龙虎| 哈尔滨百家乐赌场| 网上现金博彩网| 利博百家乐官网的玩法技巧和规则 | 六合彩全年资料| 神人百家乐官网赌场| 波音系列| 太阳城紫玉园| 揭秘百家乐百分之50| 2024年九运的房屋风水| 尊龙国际娱乐|