吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹幾大引人注目的開(kāi)源大數(shù)據(jù)工具

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來(lái)源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2018-01-29 08:46 ? 次閱讀

大數(shù)據(jù)技術(shù)領(lǐng)域正被越來(lái)越多的公司關(guān)注,而開(kāi)源一直是大數(shù)據(jù)技術(shù)的靈魂。隨著一些細(xì)分領(lǐng)域?qū)Υ髷?shù)據(jù)工具提出更高的期望和要求,一批更高效更有針對(duì)性的大數(shù)據(jù)工具先后誕生,以下將為您介紹幾大引人注目的開(kāi)源大數(shù)據(jù)工具。

介紹幾大引人注目的開(kāi)源大數(shù)據(jù)工具

一、Hadoop相關(guān)工具

1. Hadoop

Apache的Hadoop項(xiàng)目已幾乎與大數(shù)據(jù)劃上了等號(hào)。它不斷壯大起來(lái),已成為一個(gè)完整的生態(tài)系統(tǒng),眾多開(kāi)源工具面向高度擴(kuò)展的分布式計(jì)算。

支持的操作系統(tǒng):Windows、Linux和OS X。

2. Ambari

作為Hadoop生態(tài)系統(tǒng)的一部分,這個(gè)Apache項(xiàng)目提供了基于Web的直觀界面,可用于配置、管理和監(jiān)控Hadoop集群。有些開(kāi)發(fā)人員想把Ambari的功能整合到自己的應(yīng)用程序當(dāng)中,Ambari也為他們提供了充分利用REST(代表性狀態(tài)傳輸協(xié)議)的API

支持的操作系統(tǒng):Windows、Linux和OS X。

3. Avro

這個(gè)Apache項(xiàng)目提供了數(shù)據(jù)序列化系統(tǒng),擁有豐富的數(shù)據(jù)結(jié)構(gòu)和緊湊格式。模式用JSON來(lái)定義,它很容易與動(dòng)態(tài)語(yǔ)言整合起來(lái)。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

4. Cascading

Cascading是一款基于Hadoop的應(yīng)用程序開(kāi)發(fā)平臺(tái)。提供商業(yè)支持和培訓(xùn)服務(wù)。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

5. Chukwa

Chukwa基于Hadoop,可以收集來(lái)自大型分布式系統(tǒng)的數(shù)據(jù),用于監(jiān)控。它還含有用于分析和顯示數(shù)據(jù)的工具。

支持的操作系統(tǒng):Linux和OS X。

6. Flume

Flume可以從其他應(yīng)用程序收集日志數(shù)據(jù),然后將這些數(shù)據(jù)送入到Hadoop。官方網(wǎng)站聲稱:“它功能強(qiáng)大、具有容錯(cuò)性,還擁有可以調(diào)整優(yōu)化的可靠性機(jī)制和許多故障切換及恢復(fù)機(jī)制。”

支持的操作系統(tǒng):Linux和OS X。

7. HBase

HBase是為有數(shù)十億行和數(shù)百萬(wàn)列的超大表設(shè)計(jì)的,這是一種分布式數(shù)據(jù)庫(kù),可以對(duì)大數(shù)據(jù)進(jìn)行隨機(jī)性的實(shí)時(shí)讀取/寫(xiě)入訪問(wèn)。它有點(diǎn)類似谷歌的Bigtable,不過(guò)基于Hadoop和Hadoop分布式文件系統(tǒng)(HDFS)而建。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

8. Hadoop分布式文件系統(tǒng)(HDFS)

HDFS是面向Hadoop的文件系統(tǒng),不過(guò)它也可以用作一種獨(dú)立的分布式文件系統(tǒng)。它基于Java,具有容錯(cuò)性、高度擴(kuò)展性和高度配置性。

支持的操作系統(tǒng):Windows、Linux和OS X。

9. Hive

Apache Hive是面向Hadoop生態(tài)系統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)。它讓用戶可以使用HiveQL查詢和管理大數(shù)據(jù),這是一種類似SQL的語(yǔ)言。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

10. Hivemall

Hivemall結(jié)合了面向Hive的多種機(jī)器學(xué)習(xí)算法。它包括諸多高度擴(kuò)展性算法,可用于數(shù)據(jù)分類、遞歸、推薦、k最近鄰、異常檢測(cè)和特征哈希。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

11. Mahout

據(jù)官方網(wǎng)站聲稱,Mahout項(xiàng)目的目的是“為迅速構(gòu)建可擴(kuò)展、高性能的機(jī)器學(xué)習(xí)應(yīng)用程序打造一個(gè)環(huán)境。”它包括用于在Hadoop MapReduce上進(jìn)行數(shù)據(jù)挖掘的眾多算法,還包括一些面向Scala和Spark環(huán)境的新穎算法。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

12. MapReduce

作為Hadoop一個(gè)不可或缺的部分,MapReduce這種編程模型為處理大型分布式數(shù)據(jù)集提供了一種方法。它最初是由谷歌開(kāi)發(fā)的,但現(xiàn)在也被本文介紹的另外幾個(gè)大數(shù)據(jù)工具所使用,包括CouchDB、MongoDB和Riak。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

13. Oozie

這種工作流程調(diào)度工具是為了管理Hadoop任務(wù)而專門設(shè)計(jì)的。它能夠按照時(shí)間或按照數(shù)據(jù)可用情況觸發(fā)任務(wù),并與MapReduce、Pig、Hive、Sqoop及其他許多相關(guān)工具整合起來(lái)。

支持的操作系統(tǒng):Linux和OS X。

14. Pig

Apache Pig是一種面向分布式大數(shù)據(jù)分析的平臺(tái)。它依賴一種名為Pig Latin的編程語(yǔ)言,擁有簡(jiǎn)化的并行編程、優(yōu)化和可擴(kuò)展性等優(yōu)點(diǎn)。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

15. Sqoop

企業(yè)經(jīng)常需要在關(guān)系數(shù)據(jù)庫(kù)與Hadoop之間傳輸數(shù)據(jù),而Sqoop就是能完成這項(xiàng)任務(wù)的一款工具。它可以將數(shù)據(jù)導(dǎo)入到Hive或HBase,并從Hadoop導(dǎo)出到關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)(RDBMS)。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

16. Spark

作為MapReduce之外的一種選擇,Spark是一種數(shù)據(jù)處理引擎。它聲稱,用在內(nèi)存中時(shí),其速度比MapReduce最多快100倍;用在磁盤上時(shí),其速度比MapReduce最多快10倍。它可以與Hadoop和Apache Mesos一起使用,也可以獨(dú)立使用。

支持的操作系統(tǒng):Windows、Linux和OS X。

17. Tez

Tez建立在Apache Hadoop YARN的基礎(chǔ)上,這是“一種應(yīng)用程序框架,允許為任務(wù)構(gòu)建一種復(fù)雜的有向無(wú)環(huán)圖,以便處理數(shù)據(jù)。”它讓Hive和Pig可以簡(jiǎn)化復(fù)雜的任務(wù),而這些任務(wù)原本需要多個(gè)步驟才能完成。

支持的操作系統(tǒng):Windows、Linux和OS X。

18. Zookeeper

這種大數(shù)據(jù)管理工具自稱是“一項(xiàng)集中式服務(wù),可用于維護(hù)配置信息、命名、提供分布式同步以及提供群組服務(wù)。”它讓Hadoop集群里面的節(jié)點(diǎn)可以彼此協(xié)調(diào)。

支持的操作系統(tǒng):Linux、Windows(只適合開(kāi)發(fā)環(huán)境)和OS X(只適合開(kāi)發(fā)環(huán)境)。

二、大數(shù)據(jù)分析平臺(tái)和工具

19. Disco

Disco最初由諾基亞開(kāi)發(fā),這是一種分布式計(jì)算框架,與Hadoop一樣,它也基于MapReduce。它包括一種分布式文件系統(tǒng)以及支持?jǐn)?shù)十億個(gè)鍵和值的數(shù)據(jù)庫(kù)。

支持的操作系統(tǒng):Linux和OS X。

20. HPCC

作為Hadoop之外的一種選擇,HPCC這種大數(shù)據(jù)平臺(tái)承諾速度非常快,擴(kuò)展性超強(qiáng)。除了免費(fèi)社區(qū)版外,HPCC Systems還提供收費(fèi)的企業(yè)版、收費(fèi)模塊、培訓(xùn)、咨詢及其他服務(wù)。

支持的操作系統(tǒng):Linux。

21. Lumify

Lumify歸Altamira科技公司(以國(guó)家安全技術(shù)而聞名)所有,這是一種開(kāi)源大數(shù)據(jù)整合、分析和可視化平臺(tái)。你只要在Try.Lumify.io試一下演示版,就能看看它的實(shí)際效果。

支持的操作系統(tǒng):Linux。

22. Pandas

Pandas項(xiàng)目包括基于Python編程語(yǔ)言的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具。它讓企業(yè)組織可以將Python用作R之外的一種選擇,用于大數(shù)據(jù)分析項(xiàng)目。

支持的操作系統(tǒng):Windows、Linux和OS X。

23. Storm

Storm現(xiàn)在是一個(gè)Apache項(xiàng)目,它提供了實(shí)時(shí)處理大數(shù)據(jù)的功能(不像Hadoop只提供批任務(wù)處理)。其用戶包括推特、美國(guó)天氣頻道、WebMD、阿里巴巴、Yelp、雅虎日本、Spotify、Group、Flipboard及其他許多公司。

支持的操作系統(tǒng):Linux。

三、數(shù)據(jù)庫(kù)/數(shù)據(jù)倉(cāng)庫(kù)

24. Blazegraph

Blazegraph之前名為“Bigdata”,這是一種高度擴(kuò)展、高性能的數(shù)據(jù)庫(kù)。它既有使用開(kāi)源許可證的版本,也有使用商業(yè)許可證的版本。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

25. Cassandra

這種NoSQL數(shù)據(jù)庫(kù)最初由Facebook開(kāi)發(fā),現(xiàn)已被1500多家企業(yè)組織使用,包括蘋果、歐洲原子核研究組織(CERN)、康卡斯特、電子港灣、GitHub、GoDaddy、Hulu、Instagram、Intuit、Netfilx、Reddit及其他機(jī)構(gòu)。它能支持超大規(guī)模集群;比如說(shuō),蘋果部署的Cassandra系統(tǒng)就包括75000多個(gè)節(jié)點(diǎn),擁有的數(shù)據(jù)量超過(guò)10 PB。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

26. CouchDB

CouchDB號(hào)稱是“一款完全擁抱互聯(lián)網(wǎng)的數(shù)據(jù)庫(kù)”,它將數(shù)據(jù)存儲(chǔ)在JSON文檔中,這種文檔可以通過(guò)Web瀏覽器來(lái)查詢,并且用JavaScript來(lái)處理。它易于使用,在分布式上網(wǎng)絡(luò)上具有高可用性和高擴(kuò)展性。

支持的操作系統(tǒng):Windows、Linux、OS X和安卓。

27. FlockDB

由推特開(kāi)發(fā)的FlockDB是一種非常快、擴(kuò)展性非常好的圖形數(shù)據(jù)庫(kù),擅長(zhǎng)存儲(chǔ)社交網(wǎng)絡(luò)數(shù)據(jù)。雖然它仍可用于下載,但是這個(gè)項(xiàng)目的開(kāi)源版已有一段時(shí)間沒(méi)有更新了。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

28. Hibari

這個(gè)基于Erlang的項(xiàng)目自稱是“一種分布式有序鍵值存儲(chǔ)系統(tǒng),保證擁有很強(qiáng)的一致性”。它最初是由Gemini Mobile Technologies開(kāi)發(fā)的,現(xiàn)在已被歐洲和亞洲的幾家電信運(yùn)營(yíng)商所使用。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

29. Hypertable

Hypertable是一種與Hadoop兼容的大數(shù)據(jù)數(shù)據(jù)庫(kù),承諾性能超高,其用戶包括電子港灣、百度、高朋、Yelp及另外許多互聯(lián)網(wǎng)公司。提供商業(yè)支持服務(wù)。

支持的操作系統(tǒng):Linux和OS X。

30. Impala

Cloudera聲稱,基于SQL的Impala數(shù)據(jù)庫(kù)是“面向Apache Hadoop的領(lǐng)先的開(kāi)源分析數(shù)據(jù)庫(kù)”。它可以作為一款獨(dú)立產(chǎn)品來(lái)下載,又是Cloudera的商業(yè)大數(shù)據(jù)產(chǎn)品的一部分。

支持的操作系統(tǒng):Linux和OS X。

31. InfoBright社區(qū)版

InfoBright為數(shù)據(jù)分析而設(shè)計(jì),這是一種面向列的數(shù)據(jù)庫(kù),具有很高的壓縮比。InfoBright.com提供基于同一代碼的收費(fèi)產(chǎn)品,提供支持服務(wù)。

支持的操作系統(tǒng):Windows和Linux。

32. MongoDB

mongoDB的下載量已超過(guò)1000萬(wàn)人次,這是一種極其受歡迎的NoSQL數(shù)據(jù)庫(kù)。MongoDB.com上提供了企業(yè)版、支持、培訓(xùn)及相關(guān)產(chǎn)品和服務(wù)。

支持的操作系統(tǒng):Windows、Linux、OS X和Solaris。

33. Neo4j

Neo4j自稱是“速度最快、擴(kuò)展性最佳的原生圖形數(shù)據(jù)庫(kù)”,它承諾具有大規(guī)模擴(kuò)展性、快速的密碼查詢性能和經(jīng)過(guò)改進(jìn)的開(kāi)發(fā)效率。用戶包括電子港灣、必能寶(Pitney Bowes)、沃爾瑪、德國(guó)漢莎航空公司和CrunchBase。

支持的操作系統(tǒng):Windows和Linux。

34. OrientDB

這款多模型數(shù)據(jù)庫(kù)結(jié)合了圖形數(shù)據(jù)庫(kù)的一些功能和文檔數(shù)據(jù)庫(kù)的一些功能。提供收費(fèi)支持、培訓(xùn)和咨詢等服務(wù)。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

35. Pivotal Greenplum Database

Pivotal聲稱,Greenplum是“同類中最佳的企業(yè)級(jí)分析數(shù)據(jù)庫(kù)”,能夠非常快速地對(duì)龐大的海量數(shù)據(jù)進(jìn)行功能強(qiáng)大的分析。它是Pivotal大數(shù)據(jù)庫(kù)套件的一部分。

支持的操作系統(tǒng):Windows、Linux和OS X。

36. Riak

Riak“功能完備”,有兩個(gè)版本:KV是分布式NoSQL數(shù)據(jù)庫(kù),S2提供了面向云環(huán)境的對(duì)象存儲(chǔ)。它既有開(kāi)源版,也有商業(yè)版,還有支持Spark、Redis和Solr的附件。

支持的操作系統(tǒng):Linux和OS X。

37. Redis

Redis現(xiàn)在由Pivotal贊助,這是一種鍵值緩存和存儲(chǔ)系統(tǒng)。提供收費(fèi)支持。要注意:雖然該項(xiàng)目并不正式支持Windows,不過(guò)微軟在GitHub上有一個(gè)Windows派生版。

支持的操作系統(tǒng):Linux。

四、商業(yè)智能

38. Talend Open Studio

Talend的下載量已超過(guò)200萬(wàn)人次,其開(kāi)源軟件提供了數(shù)據(jù)整合功能。該公司還開(kāi)發(fā)收費(fèi)的大數(shù)據(jù)、云、數(shù)據(jù)整合、應(yīng)用程序整合和主數(shù)據(jù)管理等工具。其用戶包括美國(guó)國(guó)際集團(tuán)(AIG)、康卡斯特、電子港灣、通用電氣三星Ticketmaster和韋里遜等企業(yè)組織。

支持的操作系統(tǒng):Windows、Linux和OS X。

39. Jaspersoft

Jaspersoft提供了靈活、可嵌入的商業(yè)智能工具,用戶包括眾多企業(yè)組織:高朋、冠群科技、美國(guó)農(nóng)業(yè)部、愛(ài)立信、時(shí)代華納有線電視、奧林匹克鋼鐵、內(nèi)斯拉斯加大學(xué)和通用動(dòng)力公司。除了開(kāi)源社區(qū)版外,它還提供收費(fèi)的報(bào)表版、亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)版、專業(yè)版和企業(yè)版。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

40. Pentaho

Pentaho歸日立數(shù)據(jù)系統(tǒng)公司所有,它提供了一系列數(shù)據(jù)整合和業(yè)務(wù)分析工具。官方網(wǎng)站上提供了三個(gè)社區(qū)版;訪問(wèn)Pentaho.com,即可了解收費(fèi)支持版方面的信息。

支持的操作系統(tǒng):Windows、Linux和OS X。

41. SpagoBI

Spago被市場(chǎng)分析師們稱為“開(kāi)源領(lǐng)袖”,它提供商業(yè)智能、中間件和質(zhì)量保證軟件,另外還提供Java EE應(yīng)用程序開(kāi)發(fā)框架。該軟件百分之分免費(fèi)、開(kāi)源,不過(guò)也提供收費(fèi)的支持、咨詢、培訓(xùn)及其他服務(wù)。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

42. KNIME

KNIME的全稱是“康斯坦茨信息挖掘工具”(Konstanz Information Miner),這是一種開(kāi)源分析和報(bào)表平臺(tái)。提供了幾個(gè)商業(yè)和開(kāi)源擴(kuò)展件,以增強(qiáng)其功能。

支持的操作系統(tǒng):Windows、Linux和OS X。

43. BIRT

BIRT的全稱是“商業(yè)智能和報(bào)表工具”。它提供的一種平臺(tái)可用于制作可以嵌入到應(yīng)用程序和網(wǎng)站中的可視化元素及報(bào)表。它是Eclipse社區(qū)的一部分,得到了Actuate、IBM和Innovent Solutions的支持。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

五、數(shù)據(jù)挖掘

44.DataMelt

作為jHepWork的后續(xù)者,DataMelt可以處理數(shù)學(xué)運(yùn)算、數(shù)據(jù)挖掘、統(tǒng)計(jì)分析和數(shù)據(jù)可視化等任務(wù)。它支持Java及相關(guān)的編程語(yǔ)言,包括Jython、Groovy、JRuby和Beanshell。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

45. KEEL

KEEL的全稱是“基于進(jìn)化學(xué)習(xí)的知識(shí)提取”,這是一種基于Java的機(jī)器學(xué)習(xí)工具,為一系列大數(shù)據(jù)任務(wù)提供了算法。它還有助于評(píng)估算法在處理遞歸、分類、集群、模式挖掘及類似任務(wù)時(shí)的效果。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

46. Orange

Orange認(rèn)為數(shù)據(jù)挖掘應(yīng)該是“碩果累累、妙趣橫生”,無(wú)論你是有多年的豐富經(jīng)驗(yàn),還是剛開(kāi)始接觸這個(gè)領(lǐng)域。它提供了可視化編程和Python腳本工具,可用于數(shù)據(jù)可視化和分析。

支持的操作系統(tǒng):Windows、Linux和OS X。

47. RapidMiner

RapidMiner聲稱擁有250000多個(gè)用戶,包括貝寶、德勤、電子港灣、思科和大眾。它提供一系列廣泛的開(kāi)源版和收費(fèi)版,不過(guò)要注意:免費(fèi)的開(kāi)源版只支持CSV格式或Excel格式的數(shù)據(jù)。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

48. Rattle

Rattle的全稱是“易學(xué)易用的R分析工具”。它為R編程語(yǔ)言提供了一種圖形化界面,簡(jiǎn)化了這些過(guò)程:構(gòu)建數(shù)據(jù)的統(tǒng)計(jì)或可視化摘要、構(gòu)建模型以及執(zhí)行數(shù)據(jù)轉(zhuǎn)換。

支持的操作系統(tǒng):Windows、Linux和OS X。

49. SPMF

SPMF現(xiàn)在包括93種算法,可用于順序模式挖掘、關(guān)聯(lián)規(guī)則挖掘、項(xiàng)集挖掘、順序規(guī)則挖掘和集群。它可以獨(dú)立使用,也可以整合到其他基于Java的程序中。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

50. Weka

懷卡托知識(shí)分析環(huán)境(Weka)是一組基于Java的機(jī)器學(xué)習(xí)算法,面向數(shù)據(jù)挖掘。它可以執(zhí)行數(shù)據(jù)預(yù)處理、分類、遞歸、集群、關(guān)聯(lián)規(guī)則和可視化。

支持的操作系統(tǒng):Windows、Linux和OS X。
六、查詢引擎

51. Drill

這個(gè)Apache項(xiàng)目讓用戶可以使用基于SQL的查詢,查詢Hadoop、NoSQL數(shù)據(jù)庫(kù)和云存儲(chǔ)服務(wù)。它可用于數(shù)據(jù)挖掘和即席查詢,它支持一系列廣泛的數(shù)據(jù)庫(kù),包括HBase、MongoDB、MapR-DB、HDFS、MapR-FS、亞馬遜S3、Azure Blob Storage、谷歌云存儲(chǔ)和Swift。

支持的操作系統(tǒng):Windows、Linux和OS X。

七、編程語(yǔ)言

52. R

R類似S語(yǔ)言和環(huán)境,旨在處理統(tǒng)計(jì)計(jì)算和圖形。它包括一套整合的大數(shù)據(jù)工具,可用于數(shù)據(jù)處理、計(jì)算和可視化。

支持的操作系統(tǒng):Windows、Linux和OS X。

53. ECL

企業(yè)控制語(yǔ)言(ECL)是開(kāi)發(fā)人員用來(lái)在HPCC平臺(tái)上構(gòu)建大數(shù)據(jù)應(yīng)用程序的語(yǔ)言。HPCC Systems官方網(wǎng)站上有集成開(kāi)發(fā)環(huán)境(IDE)、教程以及處理該語(yǔ)言的眾多相關(guān)工具。

支持的操作系統(tǒng):Linux。

八、大數(shù)據(jù)搜索

54. Lucene

基于Java的Lucene可以非常迅速地執(zhí)行全文搜索。據(jù)官方網(wǎng)站聲稱,它在現(xiàn)代硬件上每小時(shí)能夠檢索超過(guò)150GB的數(shù)據(jù),它含有強(qiáng)大而高效的搜索算法。開(kāi)發(fā)工作得到了Apache軟件基金會(huì)的贊助。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

55. Solr

Solr基于Apache Lucene,是一種高度可靠、高度擴(kuò)展的企業(yè)搜索平臺(tái)。知名用戶包括eHarmony、西爾斯、StubHub、Zappos、百思買、AT&T、Instagram、Netflix、彭博社和Travelocity。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

九、內(nèi)存中技術(shù)

56. Ignite

這個(gè)Apache項(xiàng)目自稱是“一種高性能、整合式、分布式的內(nèi)存中平臺(tái),可用于對(duì)大規(guī)模數(shù)據(jù)集執(zhí)行實(shí)時(shí)計(jì)算和處理,速度比傳統(tǒng)的基于磁盤的技術(shù)或閃存技術(shù)高出好幾個(gè)數(shù)量級(jí)。”該平臺(tái)包括數(shù)據(jù)網(wǎng)格、計(jì)算網(wǎng)格、服務(wù)網(wǎng)格、流媒體、Hadoop加速、高級(jí)集群、文件系統(tǒng)、消息傳遞、事件和數(shù)據(jù)結(jié)構(gòu)等功能。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

57. Terracotta

Terracotta聲稱其BigMemory技術(shù)是“世界上數(shù)一數(shù)二的內(nèi)存中數(shù)據(jù)管理平臺(tái)”,聲稱擁有210萬(wàn)開(kāi)發(fā)人員,250家企業(yè)組織部署了其軟件。該公司還提供商業(yè)版軟件,另外提供支持、咨詢和培訓(xùn)等服務(wù)。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

58. Pivotal GemFire/Geode

今年早些時(shí)候,Pivotal宣布它將開(kāi)放其大數(shù)據(jù)套件關(guān)鍵組件的源代碼,其中包括GemFire內(nèi)存中NoSQL數(shù)據(jù)庫(kù)。它已向Apache軟件基金會(huì)遞交了一項(xiàng)提案,以便在“Geode”的名下管理GemFire數(shù)據(jù)庫(kù)的核心引擎。還提供該軟件的商業(yè)版。

支持的操作系統(tǒng):Windows和Linux。

59. GridGain

由Apache Ignite驅(qū)動(dòng)的GridGrain提供內(nèi)存中數(shù)據(jù)結(jié)構(gòu),用于迅速處理大數(shù)據(jù),還提供基于同一技術(shù)的Hadoop加速器。它既有收費(fèi)的企業(yè)版,也有免費(fèi)的社區(qū)版,后者包括免費(fèi)的基本支持。

支持的操作系統(tǒng):Windows、Linux和OS X。

60. Infinispan

作為一個(gè)紅帽JBoss項(xiàng)目,基于Java的Infinispan是一種分布式內(nèi)存中數(shù)據(jù)網(wǎng)格。它可以用作緩存、用作高性能NoSQL數(shù)據(jù)庫(kù),或者為諸多框架添加集群功能。

支持的操作系統(tǒng):與操作系統(tǒng)無(wú)關(guān)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    3403

    瀏覽量

    42712
  • Hadoop
    +關(guān)注

    關(guān)注

    1

    文章

    90

    瀏覽量

    16036
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8908

    瀏覽量

    137792

原文標(biāo)題:全球大數(shù)據(jù)領(lǐng)域頂級(jí)開(kāi)源工具匯總

文章出處:【微信號(hào):tyutcsplab,微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    如何利用嵌入式Wi-Fi模塊玩轉(zhuǎn)智能家電?

    隨著移動(dòng)互聯(lián)技術(shù)、Wi-Fi技術(shù)的智能化應(yīng)用浪潮席卷傳統(tǒng)家電制造業(yè),包括智能冰箱、智能空調(diào)、智能水壺、智能咖啡機(jī)等在內(nèi)的一大批智能家電應(yīng)運(yùn)而生,從美國(guó)的CES展會(huì)到中國(guó)的家博會(huì),無(wú)一不是最引人注目的明星產(chǎn)品。
    發(fā)表于 09-20 07:56

    STM32 MCU是否有機(jī)會(huì)很快采用原生i3c支持呢?

    STM32 MCU 是否有機(jī)會(huì)很快采用原生 i3c 支持?許多新設(shè)備,包括來(lái)自 ST 的一些設(shè)備(如 LPS22HH),都支持它。這是一個(gè)引人注目的(新的)標(biāo)準(zhǔn)。
    發(fā)表于 12-12 07:18

    新的和引人注目的光學(xué)傳感器解決方案

    有時(shí)你不能使用傳統(tǒng)的傳感器。當(dāng)你的設(shè)計(jì)涉及到布線挑戰(zhàn),噪聲濾波問(wèn)題,電不友好的條件下,或其他惡劣或危險(xiǎn)的環(huán)境中,甚至當(dāng)你試圖處理多大的傳感器可以在一個(gè)狹小的空間工作,總之這些問(wèn)題可能足以讓你遠(yuǎn)離傳統(tǒng)的解決方案。
    發(fā)表于 06-13 15:55 ?5次下載
    新的和<b class='flag-5'>引人注目的</b>光學(xué)傳感器解決方案

    沃爾沃XC90怎么樣?超高顏值,精致的內(nèi)飾,但最引人注目的還是車子的安全系統(tǒng),這款車子真是無(wú)可挑剔

    圖中這款車子就是沃爾沃XC90,它擁有著超高顏值,精致的內(nèi)飾,但這些都只是其次,最最引人注目的就是車子的安全系統(tǒng)了,在眾多的車型中,這款沃爾沃的安全系統(tǒng)都能夠脫穎而出。 這款車子除了擁有一般車輛
    發(fā)表于 07-24 11:10 ?1347次閱讀

    全球半導(dǎo)體產(chǎn)業(yè)的三起引人注目的購(gòu)并案

    近一個(gè)多月來(lái)全球半導(dǎo)體產(chǎn)業(yè)發(fā)生三起引人注目的購(gòu)并案,分別為高通(Qualcomm)并恩智浦(NXP)、西門子(Siemens)并MentorGraphics、三星電子
    發(fā)表于 04-25 07:14 ?610次閱讀

    盤點(diǎn)CES引人注目的健康類產(chǎn)品有哪些

    諾基亞在CES 2018上發(fā)布了一款名為“諾基亞睡眠”(Nokia Sleep)的產(chǎn)品,該產(chǎn)品被稱為內(nèi)置在床墊中的“高級(jí)傳感器”。飛利浦在 CES 2018 上推出“SmartSleep”頭帶,這款貼片裝置集成了可以監(jiān)測(cè)腦部活動(dòng)的傳感器,以幫助人們輕松進(jìn)入睡眠。
    發(fā)表于 03-07 16:25 ?6694次閱讀

    瘋米科技發(fā)布兩款無(wú)線耳機(jī) 外觀設(shè)計(jì)引人注目

    9月20日,互聯(lián)網(wǎng)耳機(jī)品牌瘋米科技(Funcl)正式發(fā)布兩款新品—瘋米 W1無(wú)線藍(lán)牙耳機(jī)和瘋米 AI 無(wú)線智慧耳機(jī),售價(jià)分別為99元和299元。以超高的性價(jià)比重新定義全民無(wú)線耳機(jī),為無(wú)線耳機(jī)市場(chǎng)注入了新的活力。外觀采用了黑白兩種經(jīng)典配色,外觀設(shè)計(jì)引人注目
    發(fā)表于 09-21 14:09 ?2813次閱讀

    聯(lián)想一口氣發(fā)布20款SIoT新品,尤其以Mirage AR新品最為引人注目

    剛剛落幕的聯(lián)想創(chuàng)新科技大會(huì)2018(Lenovo Tech World)上,聯(lián)想一口氣發(fā)布20款SIoT新品。其中,Mirage AR新品尤其引人注目
    發(fā)表于 09-30 10:55 ?1431次閱讀

    物聯(lián)網(wǎng)中五個(gè)引人注目的創(chuàng)新

    物聯(lián)網(wǎng),或稱IOT,旨在創(chuàng)建一個(gè)完全連接的世界,讓設(shè)備和人們可以相互交流。 世界各地的頂尖科技企業(yè)正在不斷創(chuàng)新,并試圖推出下一個(gè)偉大的連網(wǎng)設(shè)備。在本文中,我們將介紹一些不可思議的物聯(lián)網(wǎng)設(shè)備,以及它們對(duì)科技世界的影響。
    的頭像 發(fā)表于 12-26 08:44 ?5163次閱讀

    傳統(tǒng)車企和新造車究竟是對(duì)手還是隊(duì)友?

    眾多新老組合中,最引人注目的當(dāng)屬一汽和拜騰。
    的頭像 發(fā)表于 06-03 15:01 ?2937次閱讀

    物聯(lián)網(wǎng)為什么會(huì)變化這么快

    物聯(lián)網(wǎng)也可能以更加集成、不太引人注目的形式出現(xiàn)。
    發(fā)表于 07-31 10:12 ?812次閱讀

    大數(shù)據(jù)工程師真的干不到35歲嗎

    眾所周知,當(dāng)下大數(shù)據(jù)開(kāi)發(fā)工程師是一個(gè)很吃香的職業(yè),現(xiàn)在大數(shù)據(jù)技術(shù)人才的短缺,在互聯(lián)網(wǎng)圈里越久,資歷越老,越受歡迎。但近期發(fā)現(xiàn)一個(gè)“大數(shù)據(jù)工程師干不過(guò)35”的話題引人注目
    的頭像 發(fā)表于 10-08 17:00 ?1.4w次閱讀

    過(guò)去十年引人注目的分析和人工智能錯(cuò)誤

    數(shù)據(jù)和機(jī)器學(xué)習(xí)算法所帶來(lái)的洞察可能是無(wú)價(jià)之寶,但是錯(cuò)誤會(huì)損害你的聲譽(yù),影響你的收入甚至生命安全。這些引人注目的分析和人工智能錯(cuò)誤說(shuō)明了一切可能出問(wèn)題的地方。
    的頭像 發(fā)表于 11-04 10:18 ?1785次閱讀

    互聯(lián)網(wǎng)公司的爭(zhēng)議為和如此引人注目

    一、圍繞互聯(lián)網(wǎng)公司的爭(zhēng)議互聯(lián)網(wǎng)公司之所以如此引人注目,首先在于其超高的估值。 以香港股市為例,金融類上市公司的平均市盈率(Price Earnings Ratio,簡(jiǎn)稱P/E或PER)為18,如以
    的頭像 發(fā)表于 01-12 16:25 ?2450次閱讀

    螞蟻集團(tuán)發(fā)布首個(gè)開(kāi)源金融場(chǎng)景多智能體框架

    在第七屆數(shù)字中國(guó)建設(shè)峰會(huì)上,螞蟻集團(tuán)宣布了一項(xiàng)引人注目的舉措:正式開(kāi)源其多智能體框架agentUniverse。這一框架不僅是金融領(lǐng)域的首個(gè)開(kāi)源多智能體技術(shù)框架,而且為核心金融行業(yè)提供了重要的技術(shù)支撐。
    的頭像 發(fā)表于 05-28 09:25 ?762次閱讀
    百家乐官网庄家怎样赚钱| 百家乐机器昀程序| 百家乐官网开放词典新浪| 爱赢娱乐城开户| 大发888娱乐城欢迎您| 金木棉百家乐的玩法技巧和规则| 多伦多百家乐官网的玩法技巧和规则| 银泰百家乐官网龙虎斗| 百家乐官网太阳城怎么样| 百家乐官网是不是有假| 银都娱乐| 现金斗地主| 仙居县| 阜康市| 响水县| 百家乐官网声音不印网| 沙河市| 大玩家百家乐官网游戏| 百家乐官网视频小游戏| 百家乐官网最新的投注方法| 百家乐官网游戏下裁| 百家乐官网赌场导航| 赌场百家乐官网是如何| 无锡百家乐官网的玩法技巧和规则| 优惠搏百家乐官网的玩法技巧和规则| 百家乐官网博乐城| 新西兰百家乐官网的玩法技巧和规则 | 百家乐官网是真人发牌吗| 真人百家乐开户须知| 金域百家乐娱乐城| 米其林百家乐的玩法技巧和规则| 威尼斯人娱乐城真钱游戏| 大发888客服端下载| bet365客服电话| 百家乐投注| 真钱百家乐官网公司哪个好| 乐天堂百家乐官网娱乐场| 百家乐官网现金网最好的系统哪里有可靠吗| 娱乐城百家乐官网的玩法技巧和规则| 在线百家乐赌场| 财富百家乐的玩法技巧和规则|