在經過一年多的開發工作之后,LibRec 3.0 版本終于發布了。LibRec是一個基于 Java 的開源算法工具庫,覆蓋了 70 余個各類型推薦算法,可以有效解決評分預測和物品推薦兩大關鍵的推薦問題,目前已經在 GitHub 上收獲了 1457 個 Star,612 個 Fork。
2012 年,還在新加坡南洋理工大學攻讀博士學位的郭貴冰開始關注推薦系統。當時,MyMedialite 是最知名的推薦工具庫之一。作為初學者,郭貴冰一邊看論文,一邊看MyMedialite 的代碼,然后在它的基礎上實現我自己的研究算法。
然而,很快郭貴冰就意識到一個問題,在 Linux 服務器上跑 MyMedialite 會非常麻煩,而且在并行計算的時候諸多限制(相對于 Windows 平臺),在跨平臺方面存在不足。不得已,郭貴冰只好把自己的程序改成熟悉的 Java 代碼,于是得到是最原始的 LibRec。隨著研究和學習的深入,更多的算法慢慢添加到了 LibRec 中,并托管到 GitHub 以便版本控制。
2015 年 11 月,郭貴冰以引進人才的方式加入東北大學軟件學院,任職副教授。由于精力所限,郭貴冰開始組建開源團隊。2016 年 1 月,郭貴冰、王宇峰等人組建起了最初的 LibRec 核心開發團隊,并不斷擴充團隊。
2016 年 12 月,郭貴冰團隊發布了 LibRec 2.0 版本。經過一年多的開發之后,郭貴冰團隊又在今日發布了 LibRec 3.0 版本。
▌LibRec 的特點
LibRec是基于 Java 的開源算法工具庫,覆蓋了 70 余個各類型推薦算法,有效解決評分預測和物品推薦兩大關鍵的推薦問題。
1)豐富的算法
截止到目前,LibRec已經集成了70余個推薦算法。具體包括基準算法,協同過濾算法,基于內容的算法,基于情景感知的算法,混合算法以及其他擴展算法等。同時算法中也包含了概率圖模型,張量分解模型,因子分解機,深度學習中的 RBM 模塊等算法。LibRec 中包含的所有算法均已歸類并注明實現參考文獻。
2)良好的模塊化
目前LibRec中最主要的模塊為DataModel,Recommender,Evaluator與Filter,分別負責數據的預處理,推薦模型的訓練,模型的執行,輸出結果的過濾。
3)靈活的框架配置
不同算法的配置項因配置項不同,所以每一個推薦算法分別對應一個配置文件。方便管理的同時也方便用戶根據算法的執行結果來調參。目前 LibRec 已經針對所有算法配置好了默認參數。
4)簡單的框架用法
LibRec 分別提供了 Linux 和 Windows 版本的命令行工具。用戶可以根據 LibRec 提供的手冊來編寫配置文件,并使用命令行來執行算法。最終評估結果在終端中輸出,推薦結果根據配置文件生成在相應目錄下。
▌LibRec 3.0
經過一年多的開發,LibRec 3.0 在原版本的基礎上增加了許多新特性,特別是對如今流行的深度學習、集成學習等算法的支持。
1)深度學習算法
深度學習能夠使用RNN循環神經網絡對動態或者序列數據進行建模,并且可以更加準確的學習user和item的特征。DeepLearning4J(DL4J)是一套基于Java語言的神經網絡工具包,可以構建、定型和部署神經網絡。DL4J 與 Hadoop 和 Spark 集成,支持分布式 CPU 和 GPU,為商業環境(而非研究工具目的)所設計。結合 DL4J,郭貴冰團隊開發了深度學習算法模塊。
2)POI 算法
POI 算法主要是指對用戶興趣點推薦(Point Of Interest)。根據用戶在社交網絡中的興趣和地理位置信息,分析用戶的標簽屬性和地理偏好,給用戶推薦合適的出行地點。基于地理位置,郭貴冰團隊實現了 POI 算法模塊。
3)增量更新算法
增量更新主要是提高推薦算法時效性,傳統的個性化推薦系統,采用定期離線對數據進行分析的做法來更新模型。實時個性化推薦實時分析用戶產生的數據,可以更準確地為用戶進行推薦,同時根據實時的推薦結果進行反饋,更好地改進推薦模型。增量更新模塊實現了部分推薦算法的增量更新功能。
4)集成學習算法
集成學習在機器學習算法中具有較高的準確率,不足之處就是模型的訓練過程可能比較復雜,效率不是很高。集成學習是使用一系列學習器進行學習,并使用某種規則把各個學習結果進行整合從而獲得比單個學習器更好的學習效果的一種機器學習方法。增量更新模塊實現了部分推薦算法的增量更新功能。
-
JAVA
+關注
關注
19文章
2974瀏覽量
105135 -
GitHub
+關注
關注
3文章
473瀏覽量
16564
原文標題:集合70多種推薦算法,東北大學老師用Java寫了一個開源庫,在GitHub上收獲近1500個Star
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
如何使用mbedtls開源庫
STM32 Foc開源算法是什么
算法開源相關資料下載
基于三元Golay隱寫碼的快速隱寫算法
Java數據庫連接及網絡程序設計
百度開源項目推薦java圖標庫
![百度<b class='flag-5'>開源</b>項目推薦<b class='flag-5'>java</b>圖標<b class='flag-5'>庫</b>](https://file.elecfans.com/web2/M00/49/E5/pYYBAGKhvHGASGMmAAA_gz05BCM563.png)
評論