Ubuntu下hadoop环境的搭建

Ubuntu下hadoop环境的搭建

一、必要资源的下载

1、Java jdk(jdk-8u25-linux-x64.tar.gz)的下载

具体链接为:

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

2、Hadoop(我们在这里选用hadoop0.20.2.tar.gz)的下载

具体链接为:

http://vdisk.weibo.com/s/zNZl3

二、软件的安装(将下载好的文件放在home文件夹下)

1、Java的安装(解压)

在命令行下输入

sudo tar xzvf jdk-8u25-linux-x64.tar.gz

注意:可能会提示你输入用户密码

解压完毕,Java安装完成

2、hadoop的安装(解压)

在命令行输入

sudo tar xzvf hadoop0.20.2.tar.gz

注意:可能会提示你输入用户密码

解压完毕,hadoop0.20.2安装完成

3、ssh的安装

在系统联网的情况下,在命令行输入

sudo apt-get install ssh

4、rsync的安装

在系统联网的情况下,在命令行输入

sudo apt-get install rsync

三、环境的配置

1、ssh的配置

ssh需要配置成为免密码登录状态

在命令行输入两句话:

ssh-keygen -t rsa -P ‘‘ -f ~/.ssh/id_rsa

cat ~/.ssh/id_rsa.pub >>~/.ssh/authorized_keys

配置完毕,验证ssh是否需要密码,在命令行输入:

ssh localhost

        

         以下操作在hadoop-0.20.2文件夹中的conf下进行,在命令行输入 cd Hadoop-0.20.2/conf

2、修改hadoop-env.sh中的配置

将JAVA_HOME改成你安装Java JDK的绝对路径

Gedit hadoop-env.sh

3、修改hadoop核心配置文件core-site.xml

gedit core-site.xml

<configuration>

<property>

           <name>fs.default.name</name>

           <value>hdfs://localhost:9000</value>

</property>

</configuration>

4、修改hadoop中HDFS的配置,修改replication

gedit hdfs-site.xml

<configuration>

<property>

           <name>dfs.data.dir</name>

           <value>/home/mrchor/hadoop-0.20.2/data</value>

</property>

<property>

           <name>dfs.replication</name>

           <value>1</value>

</property>

</configuration>

5、修改hadoop中MapReduce的配置文件,配置的是JobTracker的地址和端口

gedit mapred-site.xml

<configuration>

<property>

           <name>mapred.job.tracker</name>

           <value>localhost:9001</value>

</property>

</configuration>

四、hadoop的启动

以下操作在hadoop-0.20.2文件夹下进行,在命令行输入:cd hadoop-0.20.2

1、格式化hadoop中的文件系统HDFS

bin/hadoop namenode –format

2、启动hadoop环境

bin/start-all.sh

     五、完结

至此,hadoop的环境搭建完毕。

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。