相关文章链接
1. 软件的版本选择
在大数据领域,我们使用的版本一般有2个选择,一个是官方发布的版本,大多数为Apache发布的版本(一般为免费的),另一个是由其他公司对官方版本进行集成的版本(一般是要收费的);收费版本一般选择CDH的版本,它对软件做了一些兼容性处理。如果使用CDH版本,请保证CDH版本一致,才能解决兼容性问题;如下图:
apache版本:
CDH版本:
2. 各软件的具体版本
JDK版本:jdk-8u144-linux-x64.tar.gz
Zookeeper版本:zookeeper-3.4.5.tar.gz
Hadoop版本:hadoop-2.7.4.tar.gz
Kafka版本:kafka_2.11-0.10.0.0.tgz
HBase版本:hbase-0.98.6-cdh5.3.0.tar.gz
Flume版本:官方版本的Flume1.7.0
Hive版本:apache-hive-0.13.1-bin.tar.gz
3. 各应用软件的web界面显示
(因为是使用VMware安装,所以配置的是自己的host)
http://node01.ouyang.com:50070:HDFS的web页面显示
:Yarm的web页面显示
:Kafka的web页面显示,需安装Kafka-Manage
:HBase的web页面显示
:Hue的web页面显示
:Spark的web页面显示