乐观 发表于 2015-1-14 20:33:11

来一发VM假造机CentOS下hadoop集群装置历程

如果您觉得本篇CentOSLinux教程讲得好,请记得点击右边漂浮的分享程序,把好文章分享给你的好朋友们!hadoop俗称散布式盘算,最早作为一个开源项目,最后只是来历于谷歌的两份***。但是正如十年前的Linux一样,固然Hadoop最后非常复杂,但跟着近年来年夜数据的衰亡,其也取得了一个充实表现代价的舞台。这也恰是业内广泛将Hadoop看作是下一个Linux的缘故原由。
一.基于vmware的hadoop情况简述

本文先容基于多台vmware假造机来装置hadoop集群的历程及***,经由过程这个小的集群让您在当地电脑上就能够研讨hadoop的相干事情历程,有人会有疑问在小的假造机集群上研讨的了局,写的步伐可否在年夜集群上事情一般?能够一定的没成绩的。
Hadoop的一个特征是线性增加特征,即以后数目情形下,处置工夫是1,如果数据量更加,后处置工夫更加,如果在这类情形下,处置才能也更加则处置工夫也是1.
一般情形hadoop必要较多的办事器才干搭建,可是我们在家里进修怎样往找那末办事器,办理举措能够找几台pc机,在pc机上装置linux体系就能够了。
固然我们另有更复杂的举措,就是找一台高功能的电脑,在电脑上装置假造机软件,内里创立多少台假造机,然后让这些假造机组成一个小的外部局域收集,在这个收集上我们装置linux软件,java软件,装置hadoop步伐,我们就能够创立一个复杂hadoop的研讨体系,举行软件的开辟调试,在这个小的散布式集群上开辟的步伐能够无缝移植到不异版本的hadoop(分歧hadoop的版本兼容性不是很好,出格是低版本同高版本,他们的api也有些许变更)集群中。
以下是在笔者条记本上构建的一个hadoop的假造机体系,相干收集拓扑布局以下:

假造机0,呆板称号:db,ip:192.168.186.10
假造机1,呆板称号:red,ip:192.168.186.11
假造机2,呆板称号:mongdb,ip:192.168.186.12
假造机3,呆板称号:nginx,ip:192.168.186.13
如上图,4台假造机经由过程一个假造的互换机互联,开辟呆板也毗连到这个假造互换机上,假造的互换机同adsl相毗连,如许全部体系都能够间接上彀了。
上面是几个假造机的典范设置,以下:

Db的设置,如上,这个呆板的内存设置对照高,这个呆板是呆板的master办事器,必要较多的内存。因而设置了1.3g内存。
上面是red的设置,mongdb及nginx的设置同这个呆板设置不异,设置以下:

这个呆板的设置同db呆板设置不异,仅仅是内存小了些,这里内存是188m,作为调试情况已充足用了。
二.基于vmware假造机情况设置

1.网卡的Ip地点设置

接纳静态ip设置体例,避免从头启动后dhcp分派新的ip后,形成不用要的凌乱。设置以下:

2.Hosts文件设置

#cat/etc/hosts
#Donotremovethefollowingline,orvariousprograms
#thatrequirenetworkfunctionalitywillfail.
127.0.0.1localhost.localdomainlocalhost
::1localhost6.localdomain6localhost6
192.168.186.10db
192.168.186.11red
192.168.186.12mongdb
192.168.186.13nginx

必要确保每台呆板的hosts文件设置如上图所示。
烦琐设置***,在设置一台呆板后,能够编写剧本完成主动将hosts文件复制到多台呆板上。剧本以下:
#catupdate_hosts.sh
#!/bin/sh
forhostinredmongdbnginx;do
echo$host
scp/etc/hostsroot@${host}:/etc/
done
#
次要这个剧本要在root下编写,然后付与能够实行的权限(chmoda+x*.sh),然后在root权限下实行。剧本会主动完成hosts文件的复制事情。
下面历程完成后,分离登录每台呆板,把每个办事器都ping一下,如果欠亨,在细心反省一下。
3.Java设置

在每一个假造机办事器上反省是不是准确装置了java,是不是设置了java的情况变量等

如上图,1处输出java-version,然后应当输入相似2处的输入,标识java已准确装置了
同时接纳3处的下令,env|grepJAVA_HOME来反省情况变量是不是准确设置了,如果没有设置java的情况变量则必要举行设置
如果您java另有装置请用上面下令装置
yuminstalljava-1.7.0-openjdk
然后用上面下令设置情况变量。
vi/etc/profile
翻开编纂的文件后,在文件最初面增加以下内容
JAVA_HOME=/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.25/jre
JRE_HOME=/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.25/jre
PATH=$PATH:$JAVA_HOME/bin
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
exportJAVA_HOMEJRE_HOMEPATHCLASSPATH
保留加入,最初运转上面下令,使设置失效
source/etc/profile
然后再次测试下面的历程,看看是不是切合相干必要。假如您还没做到到收集搜刮一下吧。
4.ssh免登录功效设置

Hadoop经由过程ssh举行相干办理事情,次要是hadoop的办理剧本经由过程ssh近程对各个办事器举行相干的办理,包含启动,中断等。
关于怎样设置ssh的免暗码登录,请参考上面文章的相干局部:
Hadoop1.2.1Pseudo-Distributed伪散布形式设置
http://www.iigrowing.cn/hadoop1-2-1-pseudo-distributed-wei-fen-bu-mo-shi-pei-zhi.html
5.封闭相干的防火墙

Hadoop步伐在事情过程当中,各个节点间有良多步伐要举行通讯,因而我们必要对防火墙做些处置,包管这些会见能一般事情。我们这里接纳最复杂的举措是封闭研讨用集群假造机的全体防火墙.
在假造机中,启动setup步伐

选择防火墙事情这一项


鄙人面的对话框中,选择以下特别色彩的地区的相干选项,最初选择ok推出

6.下载hadoop步伐

相干历程略。
三.设置hadoop散布式集群

1.在假造机db高低载hadoop步伐,然后解紧缩到/work/apps/hadoop目次,信任你会这个操纵,不可百度一下啦。


2.设置hadoop的情况变量

进进conf目次,编纂hadoop-env.sh文件,

修正javahome的设置

JAVA_HOME=/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.25/jre
注重这个设置,要同后面设置java的时分设置不异。
3.创立目次

Name目次寄存namenode的hdfs目次及文件的元数据。
Data目次寄存datanode的数据
4.设置core-site.xml文件

vicore-site.xml

<?xmlversion="1.0"?>
<?xml-stylesheettype="text/xsl"href="configuration.xsl"?>
<!&ndash;Putsite-specificpropertyoverridesinthisfile.&ndash;>
<configuration>
<property>
<name>hadoop.tmp.dir</name>//一时文件目次
<value>/work/apps/hadoop/tmp</value>
<description>Abaseforothertemporarydirectories.</description>
</property>
<property>
<name>fs.default.name</name>//namenode的办事器的地点
<value>hdfs://db:9000</value>
</property>
<property>
<name>fs.trash.interval</name>//接纳站的文件距离工夫
<value>1440</value>
<description>Numberofminutesbetweentrashcheckpoints.
Ifzero,thetrashfeatureisdisabled.

透明 发表于 2015-1-16 20:16:21

来一发VM假造机CentOS下hadoop集群装置历程

了解Linux的网络安全,系统的安全,用户的安全等。安全对于每位用户,管理员来说是非常重要的。

谁可相欹 发表于 2015-1-25 17:54:24

安装一个新的软件时先看README,再看INSTALL然后看FAQ,最后才动手安装,这样遇到问题就知道为什么。如果Linux说明文档不看,结果出了问题再去论坛来找答案反而浪费时间。

admin 发表于 2015-2-3 13:24:02

你需要提供精确有效的信息。Linux这并不是要求你简单的把成吨的出错代码或者数据完全转储摘录到你的提问中。

第二个灵魂 发表于 2015-2-9 04:28:23

直到学习Linux这门课以后,我才知道,原来我错了。?

深爱那片海 发表于 2015-2-27 00:21:20

期间我阅读了不少关于Linux的相关资料,其中也不乏一些有趣的小故事,这既丰富了我的课余生活,也让我加深了对一些术语的理解,比玩游戏强多了。?

因胸联盟 发表于 2015-3-8 21:42:16

尽我能力帮助他人,在帮助他人的同时你会深刻巩固知识。

山那边是海 发表于 2015-3-16 22:48:48

我们这一代90后,从小接触的是windows98,家里条件好的自己有电脑装的是2000,后来又有了XP,上大学时又有了win7。

小魔女 发表于 2015-3-23 10:17:42

Linux最大的特点就是其开源性,这一点是十分难得的,这也是它能够存在到现在的原因之一。
页: [1]
查看完整版本: 来一发VM假造机CentOS下hadoop集群装置历程