很多人都認(rèn)為大數(shù)據(jù)應(yīng)用程序是IT行業(yè)的未來(lái),Hadoop是開(kāi)發(fā)大數(shù)據(jù)應(yīng)用程序最常用的技術(shù)之一。Hadoop 最早誕生于 2006 年,并在2008年成為Apache頂級(jí)項(xiàng)目,至今,Hadoop已經(jīng)走過(guò)了12個(gè)年頭,這對(duì)于任何軟件的生命周期來(lái)說(shuō)是很長(zhǎng)的。
雖然早有唱衰Hadoop的聲音,但許多國(guó)內(nèi)外企業(yè)的大數(shù)據(jù)平臺(tái)用到了非常多的 Hadoop 生態(tài)組件,因此,Hadoop技術(shù)并非老矣。話說(shuō)回來(lái),學(xué)習(xí)Hadoop并使用它并不容易,要掌握這項(xiàng)技術(shù)并成為一名成功的開(kāi)發(fā)人員,你可能需要一些好書(shū)來(lái)助你一臂之力
在本文,我收集了一系列最好的Hadoop書(shū)籍,這些書(shū)籍可以幫助你更輕松的上手這項(xiàng)技術(shù):
1、《Hadoop: The Definitive Guide》
本書(shū)對(duì)于那些需要分析數(shù)據(jù)集和建立Hadoop集群的程序員來(lái)說(shuō),絕對(duì)是一本理想指南,它將教你如何使用Apache Hadoop構(gòu)建和維護(hù)可靠的、可伸縮的分布式系統(tǒng)。還有一些關(guān)于YARN的章節(jié)以及與Hadoop相關(guān)的幾個(gè)項(xiàng)目(包括 Parquet, Flume, Crunch, and Spark),你將可以通過(guò)本書(shū)挖掘Hadoop構(gòu)建分布式數(shù)據(jù)集的強(qiáng)大功能。
2、《Hadoop Explained》
本書(shū)主要向讀者介紹Hadoop的基本概念,通過(guò)本書(shū)你將學(xué)到的有:
Hadoop組件的基礎(chǔ)知識(shí)
如何使用MapReduce
Yarn基礎(chǔ)知識(shí)
使用HDFS Federation
Hadoop的優(yōu)勢(shì)
Hadoop如何處理大數(shù)據(jù)
3、《Programming Hive》
這是一本全面的指南,通過(guò)它你將了解Hive在Hadoop生態(tài)系統(tǒng)中的工作方式,并了解如何在你的環(huán)境中設(shè)置和配置Hive。它還提供了真實(shí)的案例研究,幫助你解決大數(shù)據(jù)相關(guān)的疑難雜癥。
4、《Modern Big Data Processing with Hadoop》
本書(shū)對(duì)Hadoop組件進(jìn)行了一個(gè)全面的解釋?zhuān)鼓隳軌蚴褂肏adoop設(shè)計(jì)、構(gòu)建和執(zhí)行有效的大數(shù)據(jù)分析。如果你想成為一名Hadoop架構(gòu)專(zhuān)家,這將是你必讀的一本書(shū),通過(guò)它你將學(xué)到:
企業(yè)數(shù)據(jù)架構(gòu)原則
Hadoop與Apache Spark、Elasticsearch等多種大數(shù)據(jù)框架結(jié)合使用
使用Apache Ambari設(shè)置和部署大數(shù)據(jù)環(huán)境
使用Spark開(kāi)發(fā)大規(guī)模數(shù)據(jù)處理解決方案
理解Hadoop管理和集群部署
5、《Hadoop Security》
美亞評(píng)分4.5。如果你更關(guān)注Hadoop的安全性,那么你應(yīng)該閱讀這本書(shū),它展示了在安全漏洞發(fā)生時(shí),如何制止攻擊者破壞和修改數(shù)據(jù)的解決辦法,從本書(shū)你將學(xué)到:
如何構(gòu)建安全的Hadoop集群硬件
了解Kerberos網(wǎng)絡(luò)身份驗(yàn)證協(xié)議
數(shù)據(jù)提取和客戶(hù)端訪問(wèn)安全性
6、《Data Analytics with Hadoop》
美亞評(píng)分4.0。本書(shū)同樣是介紹Hadoop生態(tài)圈技術(shù)的指南書(shū)籍,它向你展示了如何利用Hadoop在大數(shù)據(jù)集上使用統(tǒng)計(jì)和機(jī)器學(xué)習(xí)技術(shù)。你將從這本書(shū)中學(xué)到
理解Hadoop和集群計(jì)算的基本概念
使用Spark進(jìn)行內(nèi)存計(jì)算
使用Apache Hive和HBase執(zhí)行數(shù)據(jù)挖掘和存儲(chǔ)
使用高級(jí)API進(jìn)行分析
使用Spark的MLlib進(jìn)行機(jī)器學(xué)習(xí)
7、《Expert Hadoop Administration》
美亞評(píng)分4.3。對(duì)于希望在任何環(huán)境中創(chuàng)建、配置、保護(hù)、管理和優(yōu)化Hadoop集群的Hadoop管理員來(lái)說(shuō),本書(shū)絕對(duì)是一本很棒的書(shū)。這本書(shū)解釋了復(fù)雜的Hadoop環(huán)境,并向你展示了在管理集群時(shí)背后的原理,并對(duì)問(wèn)題和解決方案進(jìn)行詳細(xì)的解釋。
8、《Architecting Modern Data Platforms》
美亞評(píng)分滿分5分。如果你是一位希望構(gòu)建端到端企業(yè)數(shù)據(jù)平臺(tái)的企業(yè)架構(gòu)師或數(shù)據(jù)工程師,那么,這本書(shū)將是你的必備指南。這本書(shū)將教你如何將Hadoop這樣的大數(shù)據(jù)技術(shù)應(yīng)用到你的大數(shù)據(jù)應(yīng)用程序當(dāng)中去,并學(xué)會(huì)在本地和云中構(gòu)建大數(shù)據(jù)平臺(tái)
9、《Practical Hive》
美亞評(píng)分滿分5分。對(duì)于希望將關(guān)系數(shù)據(jù)庫(kù)遷移到Hadoop的人來(lái)說(shuō),這本書(shū)絕對(duì)是必讀書(shū)籍,本書(shū)由數(shù)據(jù)庫(kù)專(zhuān)家和大數(shù)據(jù)專(zhuān)家共同撰寫(xiě),具體內(nèi)容包括:Hive的安裝和配置,其核心組件和架構(gòu),Hive數(shù)據(jù)操作語(yǔ)言,如何加載、查詢(xún)和分析數(shù)據(jù),Hive的性能調(diào)優(yōu)以及安全性,等等。
10、《Hadoop 2.x Administration Cookbook》
這是一本入門(mén)書(shū)籍,它將通過(guò)示例逐步解釋如何將數(shù)據(jù)導(dǎo)入和導(dǎo)出到Hive,并使用Oozie管理工作流。它還提供了實(shí)用的方法來(lái)保護(hù)Hadoop集群,并使其高度可用。通過(guò)它,入門(mén)Hadoop應(yīng)該是沒(méi)有什么大問(wèn)題。
-
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1209瀏覽量
24835 -
Hadoop
+關(guān)注
關(guān)注
1文章
90瀏覽量
16040 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8908瀏覽量
137799
原文標(biāo)題:書(shū)來(lái)了 | 2019年了,12歲的Hadoop還值得你學(xué)習(xí)么?
文章出處:【微信號(hào):TheBigData1024,微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
電子發(fā)燒友榮獲人民郵電出版社-異步社區(qū)“2024年度最佳合作伙伴獎(jiǎng)”
2024 TI高壓研討會(huì)精彩回顧
名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.47】HarmonyOS NEXT啟程:零基礎(chǔ)構(gòu)建純血鴻蒙應(yīng)用
Altera推出一系列FPGA軟、硬件和開(kāi)發(fā)工具
基于Kepware的Hadoop大數(shù)據(jù)應(yīng)用構(gòu)建-提升數(shù)據(jù)價(jià)值利用效能
![基于Kepware的<b class='flag-5'>Hadoop</b>大數(shù)據(jù)應(yīng)用構(gòu)建-提升數(shù)據(jù)價(jià)值利用效能](https://file1.elecfans.com/web2/M00/09/0E/wKgZomcE21CAHUHqAAET3eiQ6hk257.png)
地瓜機(jī)器人發(fā)布一系列通用機(jī)器人套件
【「?jìng)}頡編程快速上手」閱讀體驗(yàn)】+初步讀后感
Nexperia擴(kuò)展一系列創(chuàng)新應(yīng)用專(zhuān)用MOSFET
TLV246x一系列低功耗軌到軌輸入/輸出運(yùn)算放大器數(shù)據(jù)表
![TLV246x<b class='flag-5'>一系列</b>低功耗軌到軌輸入/輸出運(yùn)算放大器數(shù)據(jù)表](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
廣和通攜一系列AIoT解決方案亮相COMPUTEX 2024
IBM開(kāi)源AI模型,推動(dòng)AI企業(yè)化應(yīng)用
易飛揚(yáng)推出一系列創(chuàng)新硅光模塊
新思科技為AMBA CHI-G協(xié)議量身定制一系列AMBA協(xié)議解決方案
優(yōu)恩半導(dǎo)體推出一系列適用于高速數(shù)據(jù)信號(hào)ESD和EOS的保護(hù)器件
![優(yōu)恩半導(dǎo)體推出<b class='flag-5'>一系列</b>適用于高速數(shù)據(jù)信號(hào)ESD和EOS的保護(hù)器件](https://file1.elecfans.com/web2/M00/DE/30/wKgZomYt6VqAIChPAAAiqEzExaU576.png)
ARM推出一系列汽車(chē)SoC IP,RISC-V壓力又大了
![ARM推出<b class='flag-5'>一系列</b>汽車(chē)SoC IP,RISC-V壓力又大了](https://file1.elecfans.com/web2/M00/C5/23/wKgZomX6mNuAMBXfAAAsGzJPVTQ124.png)
評(píng)論