吴忠躺衫网络科技有限公司

您好,歡迎來電子發(fā)燒友網! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網>源碼下載>數值算法/人工智能>

海量嘈雜數據決策樹算法

大小:0.73 MB 人氣: 2018-01-13 需要積分:2

  針對當前決策樹算法較少考慮訓練集的嘈雜程度對模型的影響,以及傳統(tǒng)駐留內存算法處理海量數據困難的問題,提出一種基于Hadoop平臺的不確定概率C4.5算法-IP-C4.5算法。在訓練模型時,IP-C4.5算法認為用于建樹的訓練集是不可靠的,通過用基于不確定概率的信息增益率作為分裂屬性選擇標準,減小了訓練集的嘈雜性對模型的影響。在Hadoop平臺下,通過將IP-C4.5算法以文件分裂的方式進行MapReduce化程序設計,增強了處理海量數據的能力。與C4.5和完全信條樹(CCDT)算法的對比實驗結果表明,在訓練集數據是嘈雜的情況下,IP-C4.5算法的準確率相對更高,尤其當數據嘈雜度大于10%時,表現更加優(yōu)秀;并且基于Hadoop的并行化的IP-C4.5算法具有處理海量數據的能力。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關規(guī)定!

      ?
      百家乐平注法到65| 97玩棋牌游戏中心| 百家乐公式计算| 中国百家乐官网游戏| 百家乐麻将筹码币| 伟德百家乐下载| 百家乐官网网页游戏网址| 太阳城论坛| 游戏机百家乐的玩法技巧和规则| 做生意风水门面要求| 百家乐官网游戏唯一官网网站 | bet365怎么存款| 威尼斯人娱乐城送钱| 百家乐傻瓜式投注法| 至尊百家乐官网娱乐平台| 米脂县| 名门国际娱乐| 大发888zhldu| 威尼斯人娱乐城免费注册| 百家乐韩泰阁| 真人百家乐ea平台| 百家乐投注网中国| 百家乐官网专打方法| 太阳城娱乐网站| 德州扑克怎么分钱| 百家乐庄闲排| 破解百家乐真人游戏| 百家乐筹码桌布| 宝马会百家乐现金网| 怎样赢百家乐官网的玩法技巧和规则 | 百家乐赌博租| 东莞百家乐的玩法技巧和规则| 百家乐三路秘诀| 百家乐现场新全讯网| 百家乐软件编辑原理| 澳门百家乐赢钱公式不倒翁| 菲律宾百家乐太阳城| 百家乐代理在线游戏可信吗网上哪家平台信誉好安全 | 唐人街百家乐官网的玩法技巧和规则| 百家乐官网小九梭哈| 互联网百家乐官网的玩法技巧和规则 |