网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

Ubuntu14.0.4中hadoop2.4.0伪分布模式配置

浏览数：16 / 时间：2015年06月20日

一、配置core-site.xml

/usr/local/hadoop/etc/hadoop/core-site.xml 包含了hadoop启动时的配置信息。

编辑器中打开此文件

sudo gedit /usr/local/hadoop/etc/hadoop/core-site.xml

在该文件的<configuration></configuration>之间增加如下内容：

<property>

<name>fs.default.name</name>

<value>hdfs://localhost:9000</value>

</property>

保存、关闭编辑窗口。

最终修改后的文件内容如下：

二、配置yarn-site.xml

/usr/local/hadoop/etc/hadoop/yarn-site.xml包含了MapReduce启动时的配置信息。

编辑器中打开此文件

sudo gedit yarn-site.xml

在该文件的<configuration></configuration>之间增加如下内容：

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

保存、关闭编辑窗口

最终修改后的文件内容如下

三、创建和配置mapred-site.xml

默认情况下，/usr/local/hadoop/etc/hadoop/文件夹下有mapred.xml.template文件，我们要复制该文件，并命名为mapred.xml，该文件用于指定MapReduce使用的框架。

复制并重命名

cp mapred-site.xml.template mapred-site.xml

编辑器打开此新建文件

sudo gedit mapred-site.xml

在该文件的<configuration></configuration>之间增加如下内容：

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

保存、关闭编辑窗口

最终修改后的文件内容如下

四、配置hdfs-site.xml

/usr/local/hadoop/etc/hadoop/hdfs-site.xml用来配置集群中每台主机都可用，指定主机上作为namenode和datanode的目录。

创建文件夹，如下图所示

你也可以在别的路径下创建上图的文件夹，名称也可以与上图不同，但是需要和hdfs-site.xml中的配置一致。

编辑器打开hdfs-site.xml

在该文件的<configuration></configuration>之间增加如下内容：

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>file:/usr/local/hadoop/hdfs/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>file:/usr/local/hadoop/hdfs/data</value>

</property>

保存、关闭编辑窗口

最终修改后的文件内容如下：

五、格式化hdfs

hdfs namenode -format

只需要执行一次即可，如果在hadoop已经使用后再次执行，会清除掉hdfs上的所有数据。

六、启动Hadoop

经过上文所描述配置和操作后，下面就可以启动这个单节点的集群

执行启动命令：

sbin/start-dfs.sh

执行该命令时，如果有yes /no提示，输入yes，回车即可。

接下来，执行：

sbin/start-yarn.sh

执行完这两个命令后，Hadoop会启动并运行

执行 jps命令，会看到Hadoop相关的进程，如下图：

浏览器打开 http://localhost:50070/，会看到hdfs管理页面

浏览器打开http://localhost:8088，会看到hadoop进程管理页面

七、WordCount验证

dfs上创建input目录

bin/hadoop fs -mkdir -p input

把hadoop目录下的README.txt拷贝到dfs新建的input里

hadoop fs -copyFromLocal README.txt input

运行WordCount

hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.4.0-sources.jar org.apache.hadoop.examples.WordCount input output

可以看到执行过程

运行完毕后，查看单词统计结果

hadoop fs -cat output/*

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

Ubuntu14.0.4中hadoop2.4.0伪分布模式配置

标签： class src 使用文件 com 数据 log word http class src 使用文件 com 数据 log word http

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

男子在背上刺《清明上河图》历时7天完成

男子在背上刺《清明上河图》历时7天完成

悉尼海滩百人裸泳狂欢一丝不挂惊爆眼球

悉尼海滩百人裸泳狂欢一丝不挂惊爆眼球

泰国平潭岛旅游

泰国平潭岛旅游

三岁女童来深圳两月后失踪尸现废弃老屋

三岁女童来深圳两月后失踪尸现废弃老屋

杨幂变黑衣人现身酒店

杨幂变黑衣人现身酒店

职业模特拍摄省事很多

职业模特拍摄省事很多

全国高校校花新鲜出炉

全国高校校花新鲜出炉

2015北影表演专业考试首日校内颜值爆表

2015北影表演专业考试首日校内颜值爆表

广州海陆空盛筵开场比基尼美女助阵

广州海陆空盛筵开场比基尼美女助阵

红色延安十大美女的人生结局

红色延安十大美女的人生结局

您可能还喜欢

更多

女子占座被指责飞踹老人

女子占座被指责飞踹老人

世界美女地图个个都十分美丽身材惹火性感

世界美女地图个个都十分美丽身材惹火性感

特斯拉入门两厢车新车预览

特斯拉入门两厢车新车预览

亮瞎眼！帅哥美女骑行西藏前后惊悚对比

亮瞎眼！帅哥美女骑行西藏前后惊悚对比

2014年Chinajoy精选

2014年Chinajoy精选

欧美比基尼精选

欧美比基尼精选

栩栩如生的街头三维立体画--绝对逼真

栩栩如生的街头三维立体画--绝对逼真

国外甜美金发MM

国外甜美金发MM

让人心灵震惊！你能坚持看到第几张？

让人心灵震惊！你能坚持看到第几张？

2019“俄罗斯小姐”选美大赛，最终 Alina Sanko 夺冠

2019“俄罗斯小姐”选美大赛，最终 Alina Sanko 夺冠