博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hadoop学习笔记(四)Hadoop伪分布式配置
阅读量:5743 次
发布时间:2019-06-18

本文共 2815 字,大约阅读时间需要 9 分钟。

Hadoop配置文档(二)

这一篇是介绍Hadoop伪分布式的配置中的Hadoop的配置。第一部分是Hadoop1.0配置,第二部分是Hadoop2.0的配置,大家可以自己选择查看。

Linux配置可以查看

Hadoop1.0配置介绍

Hadoop的五个核心守护进程有:NameNode,SecondaryNameNode,DataNode,JobTracker,TaskTracker

所以不难理解,Hadoop方面的配置主要是对五个核心守护进程的配置。

NameNode配置

cd $HADOOP_HOME/conf/vim core-site.xml

配置文件如下

fs.default.name
hdfs://HOSTADDRESS:9000
hadoop.tmp.dir
/opt/data/tmp

注意缓存文件地址手动创建,可以自由配置

DataNode

cd $HADOOP_HOME/conf/vim hdfs-site.xml

配置文件如下

dfs.replication
1
dfs.permissions
false

SecondaryNameNode

cd $HADOOP_HOME/conf/vim masters

将localhost替换为$HOSTNAME

指定SecondaryNameNode位置

JobTracker

cd $HADOOP_HOME/conf/vim mapred-site.xml

文件配置如下

mapred.jdo.tracker
HOSTADDRESS:9001

TaskTracker

cd $HADOOP_HOME/conf/vim slaves

将localhost替换为$HOSTNAME。

指定DataNode和TaskTracker的位置

编译环境

cd $HADOOP_HOME/conf/vim hadoop-env.sh

启用JDK配置,并配置到对应的JDK位置

NameNode格式化

cd $HADOOP_HOME/bin/hadoop namenode -format

测试

start-dfs.shjps

jps查看java虚拟机运行进程,成功则显示

这里写图片描述

start-mapred.shjps

成功显示显示如下

JobTracker,TaskTracker

异常

若此时存在守护进程没有启动的情况,通常存在两种问题

  1. XML配置错误,XML文件修改过后,需要进行namenode formate
  2. 文件权限问题

文件权限问题需要对文件权限进行修改。

修改到的文件权限涉及到的目录主要有:

$HADOOP_HOME和TEMP目录,若存在相关问题可以更改文件权限解决

Hadoop2.0配置介绍

基本原理和第一篇相同,所以重复的内容就不浪费时间

core-site.xml

配置NameNode地址

fs.defaultFS
hdfs://thread.com:9000

hdfs-site.xml

配置副本数

dfs.replication
1

mapred-site.xml

此处与Hadoop1.0不同,Hadoo2.0的资源调度交由yarn框架进行调度

mapreduce.framework.name
yarn

yarn-site.xml

yarn是资源调度框架,详细这边不多做介绍

yarn.nodemanager.aux-services
mapreduce_shuffle

NameNode格式化

cd $HADOOP_HOME/bin/hadoop namenode -format

测试

start-all.shjps

jps查看java虚拟机运行进程,成功则显示

这里写图片描述

异常

若此时存在守护进程没有启动的情况,通常存在三种问题

  1. XML配置错误,XML文件修改过后,需要进行namenode formate
  2. 文件权限问题
  3. namenode在formate之后,datanode无法启动

文件权限问题需要对文件权限进行修改。

修改到的文件权限涉及到的目录主要有:

$HADOOP_HOME和TEMP目录,若存在相关问题可以更改文件权限解决

第三种情况,是由于datanode在创建后会保存namenode版本号,而namenode formate之后,版本号更新,datanode的版本号无法与最新namenode版本号进行匹配,需要手动更新

默认配置地址在/temp/hadoop-USERNAME/dfs/name/current/VERSION
以及/temp/hadoop-USERNAME/dfs/data/current/VERSION

nameVersion文件中

clusterID=CID-9d26b796-f8bd-41ec-a829-07b3c641ae9b

dataVersion文件中也存在clusterID,如果不匹配,则可以进行匹配

欢迎继续学习使用Hadoop

转载于:https://www.cnblogs.com/cunchen/p/9464210.html

你可能感兴趣的文章
基础005_V7-Select IO
查看>>
素数+map BestCoder Round #54 (div.2) 1002 The Factor
查看>>
P1772 [ZJOI2006]物流运输
查看>>
Release和Debug的区别[转]
查看>>
oracle11g 数据库导出报“ EXP-00003:
查看>>
机器学习 —— 基础整理(三)生成式模型的非参数方法: Parzen窗估计、k近邻估计;k近邻分类器...
查看>>
Luogu_2876_[USACO07JAN]解决问题Problem Solving
查看>>
Oracle RAC 并发与架构
查看>>
136. Single Number
查看>>
web前端开发教程系列-2 - 前端开发书籍分享(转)
查看>>
linux常用命令 print格式输出
查看>>
count-the-repetitions
查看>>
代码分享h5-sessionStorage,提示app下载代码块
查看>>
pl/sql developer 中文字段显示乱码( 转载)
查看>>
location.href语句与火狐不兼容的问题
查看>>
eclipse中git的使用
查看>>
ajax请求
查看>>
django orm
查看>>
python中的 == 和 is
查看>>
检查密码复杂度的C#正则表达式
查看>>