> 文章列表 > hadoop集群基础

hadoop集群基础

hadoop集群基础

hadoop1.0 mapreduce + HDFS
hadoop2.0 mapreduce + HDFS + YARN
加入YARN使得hadoop更加包容,其他的组件也可以在hadoop生态系统中运行
hadoop3.0 HDFS(分布式存储) + mapreduce(分布式计算框架) + YARN(集群资源调度)
3.0 1最低支持JAVA8 2加入了纠删码,可大幅压缩存储空间,提高存储效率

hadoop环境安装
下载包选tar.gz 关闭防火墙 设置主机名 hostname=bigdata01 或 vim /etc/hostname
名称与IP建立联系 vim /etc/host : 192.168.70.128 bigdata01
JVM ENV: 下载解压安装包tar.gz tar -zxvf jdk_8u…
配置环境变量:vim /etc/profile: export JAVA_HOME = /data/soft/jdk1.8
export PATH =.: J A V A H O M E / b i n : JAVA_HOME/bin: JAVAHOME/bin:PATH
Source /etc/profile
Java -version

Install hadoop:
Tar -zxvf hadoop-3.2.2.tar.gz
配置环境变量:vim /etc/profile : export HADOOP_HOME=/data/soft/hadoop-3.2.2
Export P A T H = . : PATH=.: PATH=.:HADOOP_HOME/bin: H A D O O P H O M E / s b i n : HADOOP_HOME/sbin: HADOOPHOME/sbin:PATH

Bin/ 操作hdfs和yarn组件的脚本
Sbin/ 启动和停止组件。。。

/etc/hadoop/:
Hadoop-env.sh 环境变量java hadoop
编辑配置文件 hadoop-3.2.2/etc/hadoop/hadoop-env.sh:
Export JAVA_HOME=/data/soft/jdk1.8
Export HADOOP_LOG_DIR=/data/hadoop_report/logs/hadoop

core-site.xml 配置主机名和端口,临时目录
Hdfs-site.sh 设置集群的节点个数(包括主节点)
Mapred-site.xml 配置使用的资源调度框架
Yarn-site.xml 配置yarn上可支持使用的服务和白名单
Workers 将从节点的hostname写进去

使用前需格式化系统:
bin/hdfs namenode -format

启动集群: sbin/start-dfs.sh
启动前需先配置一些信息在脚本中:
vim Sbin/start-dfs.sh :
Vim sbin/stop-dfs.sh:
Vim sbin/start-yarn.sh:
Vim sbin/stop-yarn.sh:

Jps
Namenode
Datanode
Resourcemanager
Secondarynamenode
Nodemanager

主节点:
namenode
resource manager
secondary namenode
jvm
linux os
server

从节点:
datanode
node manager
jvm
linux os
server