hadoop安装

介绍

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。

Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。

软件获取

1
2
3
4
5
6
7
8
wget http://mirrors.shu.edu.cn/apache/hadoop/common/hadoop-2.8.4/hadoop-2.8.4.tar.gz

mv hadoop-2.8.4.tar.gz /opt
cd /opt

tar xvf hadoop-2.8.4.tar.gz

ln -s /opt/hadoop-2.8.4 /opt/hadoop

环境变量配置

1
2
3
4
5
6
7
8
9
10
11
# JAVA环境变量
export JAVA_HOME=/opt/jdk1.8.0_121
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH

# hadoop环境变量
export HADOOP_HOME=/opt/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib:$HADOOP_COMMON_LIB_NATIVE_DIR"

修改core-site.xml

1
2
3
4
5
6
7
8
9
╭─wuyue@wuyue-PC ~  
╰─$ vi /opt/hadoop/etc/hadoop/core-site.xml

# 将下面的内容添加到<configuration>标签内
# wuyue-pc 可以为IP地址
<property>
<name>fs.default.name</name>
<value>hdfs://wuyue-pc:9000</value>
</property>

修改hadoop-env.sh

1
2
3
4
5
6
7
╭─wuyue@wuyue-PC ~  
╰─$ vi /opt/hadoop/etc/hadoop/hadoop-env.sh

# 修改JAVA环境变量为你的JAVA环境变量
# The java implementation to use.
# export JAVA_HOME=${JAVA_HOME}
export JAVA_HOME=/opt/jdk1.8.0_121

初始化hdfs

1
hdfs namenode -format

启动

1
2
/opt/hadoop/sbin/start-dfs.sh
/opt/hadoop/sbin/start-yarn.sh

管理地址

1
2
3
4
5
# 集群
http://wuyue-pc:8088

# hdfs文件系统
http://wuyue-pc:50070