第三方發(fā)行版(如:CDH,HDP等)
1)優(yōu)點(diǎn):
i)基于Apache協(xié)議,100%開源。
ii)版本管理簡(jiǎn)單清晰:像Cloudera的CDH4.1.0 patch level 923.142,表示在原生態(tài)Apache Hadoop 0.20.2基礎(chǔ)上添加了1065個(gè)patch。
iii)兼容性、安全性、穩(wěn)定性強(qiáng):第三方發(fā)行版通常基于穩(wěn)定版的Apache Hadoop,并應(yīng)用最新的補(bǔ)丁。同時(shí),這些版本都經(jīng)過了大量的測(cè)試驗(yàn)證,有眾多的實(shí)際部署,且大量部署于各種生產(chǎn)環(huán)境,因此,比原生態(tài)Apache Hadoop擁有更好的兼容性、安全性和穩(wěn)定性。
iv)版本更新快:例如:通常,CDH每季度會(huì)發(fā)布一個(gè)update,每年會(huì)發(fā)布一個(gè)release。
v)提供部署、安裝和配置工具:第三方發(fā)行版會(huì)提供方便易用的安裝部署和管理工具,這將不但大大提高集群部署的效率,同時(shí)后期管理和維護(hù)也會(huì)非常方便和高效。
2)缺點(diǎn):
i)因?yàn)橛行┑谌桨姹緯?huì)收費(fèi),這將會(huì)提高開發(fā)和運(yùn)營(yíng)成本。
ii)后期管理和運(yùn)維都會(huì)涉及廠商鎖定問題。
三、第三方發(fā)行版間比較
1.Cloudera:目前發(fā)布最成熟的發(fā)行版本,擁有最多的部署案例,提供簡(jiǎn)單、易用、方便、強(qiáng)大的部署、管理和運(yùn)維工具,同時(shí),Cloudera公司還開發(fā)并貢獻(xiàn)了可實(shí)時(shí)處理大數(shù)據(jù)的Impala項(xiàng)目。
2.Hortonworks:為使用100%開源Apache Hadoop的唯一提供商,Hortonworks首次使用Apache HCatalog的元數(shù)據(jù)服務(wù)特性,同時(shí),其Stinger開創(chuàng)性、極大程度的優(yōu)化了Hive項(xiàng)目。Hortonworks為使用者提供了一個(gè)友好、方便、易用、入門級(jí)的的沙盒工具。Hortonworks開發(fā)了很多hadoop增強(qiáng)特性并提交至核心主干,從而使得Apache Hadoop在Windows Server和Windows Azure等在內(nèi)的Microsft Windows平臺(tái)上平穩(wěn)高效的運(yùn)行。