(1) CDH對(duì)Hadoop版本的劃分非常清晰,只有兩個(gè)系列的版本,分別是CDH3和CDH4,分別對(duì)應(yīng)Hadoop 1.0和Hadoop 2.0。相比而言,Apache版本則混亂得多。
? ? ?
? (2) CDH比Apache在兼容性,安全性,穩(wěn)定性上有增強(qiáng)。
? ? ?
? (3) CDH3版本是基于Apache ?Hadoop ?0.20.2改進(jìn)的,并融入了最新的patch,CDH4版本是基于Apache Hadoop 2.X改進(jìn)的,CDH總是并應(yīng)用了最新Bug修復(fù)或者Feature的Patch,并比Apache hadoop同功能版本提早發(fā)布,更新速度比Apache官方快。
? ??
? ? ?(4)CDH支持Kerberos安全認(rèn)證,Apache則使用簡(jiǎn)陋的用戶(hù)名匹配認(rèn)證.
? ??
? ? ?(5) CDH文檔清晰,很多采用Apache版本的用戶(hù)都會(huì)閱讀CDH提供的文檔,包括安裝文檔、升級(jí)文檔等。
? ??
? ? ?(6) CDH支持Yum/Apt包,Tar包,RPM包,Cloudera Manager四種方式安裝,Apache 只支持Tar包安裝。
?
注:CDH使用推薦的Yum/Apt包安裝時(shí),有以下幾個(gè)好處:
1、聯(lián)網(wǎng)安裝、升級(jí),非常方便
2、自動(dòng)下載依賴(lài)軟件包
3、Hadoop生態(tài)系統(tǒng)包自動(dòng)匹配,不需要你尋找與當(dāng)前Hadoop匹配的Hbase,F(xiàn)lume,Hive等軟件,Yum/Apt會(huì)根據(jù)當(dāng)前安裝Hadoop版本自動(dòng)尋找匹配版本的軟件包,并保證兼容性。
4、自動(dòng)創(chuàng)建相關(guān)目錄并軟鏈到合適的地方(如conf和logs等目錄);自動(dòng)創(chuàng)建hdfs, mapred用戶(hù),hdfs用戶(hù)是HDFS的最高權(quán)限用戶(hù),mapred用戶(hù)則負(fù)責(zé)mapreduce執(zhí)行過(guò)程中相關(guān)目錄的權(quán)限。