Hadoop安裝文檔
題目:
Hadoop 安裝文檔
文檔信息 變更歷史
目 錄
文檔信息 . ............................................................................................................ 1
變更歷史 . ............................................................................................................ 1 1
環境準備 . ..................................................................................................... 4 1.1
準備安裝介質 ........................................................................................... 4 1.2
卸載OPEN-JAVA .................................................................................... 4 1.3
安裝SUN-JDK . ........................................................................................ 4 1.4
編輯HOSTS 文件 .................................................................................... 5 1.5
關閉SELINUX 安全驗證和IPTABLES . ................................................... 5 1.5.1
關閉SELINUX 安全驗證 ...................................................................... 5 1.5.2
關閉IPTABLES ................................................................................... 5 1.6
創建新用戶 . .............................................................................................. 5 1.6.1
創建用戶修改密碼 ................................................................................ 5 1.6.2
集羣間設置SSH 無密碼訪問 ................................................................ 6 2
安裝HADOOP ............................................................................................ 6 2.1
解壓 HADOOP TAR包 ........................................................................... 6 2.2
設置HADOOP 環境變量.......................................................................... 6 2.3
修改HADOOP 的配置文件 ...................................................................... 7 2.3.1
配置CONF/CORE-SITE.XML文件 . ..................................................... 7 2.3.2
配置CONF/MAPRED-SITE.XML文件................................................. 7 2.3.3
配置CONF/ HDFS-SITE.XML文件 ..................................................... 8 2.3.4 配置CONF/HADOOP-ENV.SH文件 . ................................................... 8
2.3.5
配置MASTERS 文件 ........................................................................... 8 2.3.6
配置SLAVES 文件 . .............................................................................. 9 2.4
啓動HADOOP . ........................................................................................ 9 2.4.1
格式化NAMENODE ............................................................................ 9 2.4.2
啓動HADOOP ..................................................................................... 9 2.4.3 查看WEB 頁面 .................................................................................. 10 3
安裝HBASE ............................................................................................. 10 3.1
解壓HBASE TAR包 ............................................................................. 10 3.2
設置HBASE 的環境變量 ....................................................................... 10 3.3
修改HBASE 的配置文件 ....................................................................... 11 3.3.1
配置CONF/HBASE-SITE.XML文件 ................................................. 11 3.3.2
配置HBASE-ENV.SH 文件 ................................................................ 11 3.3.3
配置REGIONSERVERS 文件 . ........................................................... 12 3.4
啓動HBASE .......................................................................................... 12 3.4.1 查看WEB 頁面 .................................................................................. 12 4
安裝HIVE . ................................................................................................. 12 4.1
解壓HIVE TAR包.................................................................................. 12 4.2
配置環境變量 ......................................................................................... 12 4.3 進入命令行 . ............................................................................................ 13 5 使用JPS 查看進程 .................................................................................... 14
1 環境準備
1.1 準備安裝介質
Hadoop 官網下載地址:
Hive 官網下載地址:
HBase 官網下載地址:
1.2 卸載open-java
查看系統自帶的已經安裝的java
$rpm -qa | grep java
java-1.4.2-gcj-compat-1.4.2.0-40jpp.115
java-1.6.0-openjdk-1.6.0.0-1.7.b09.el5
卸載自帶java
$rpm -e --nodeps java-1.4.2-gcj-compat-1.4.2.0-40jpp.115
$rpm -e --nodeps java-1.6.0-openjdk-1.6.0.0-1.7.b09.el5
1.3 安裝Sun-jdk
$cd /usr
unzip Sun-JDK
$vim /etc/profile
export JAV A_HOME=/usr/jdk1.6
export PATH=$PATH:$JAV A_HOME/bin:$JAV A_HOME/jre/bin
export CLASSPATH=.:$JAV A_HOME/lib:$JAV A_HOME/jre/lib:$CLASSPATH $source /etc/profile
1.4 編輯hosts 文件
將集羣中所有伺服器的hostname 添加到hosts 文件中
$vi /etc/hosts
1.5 關閉selinux 安全驗證和iptables
1.5.1 關閉selinux 安全驗證
$vi /etc/sysconfig/selinux
修改SELINUX 變量爲disabled
SELINUX=disabled
使設置生效,不用重啓機器
$setenforce 0
1.5.2 關閉iptables
停止服務
$service iptables stop
關閉開機啓動
$chkconfig iptables off
1.6 創建新用戶
1.6.1 創建用戶修改密碼
$useradd hd
$passwd hd
1.6.2 集羣間設置ssh 無密碼訪問 $mkdir ~/.ssh
$chmod 700 ~/.ssh/
在集羣中所有伺服器上生成密鑰文件
$ cd ~/.ssh
$ ssh-keygen -t dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
$ chmod 600 ~/.ssh/authorized_keys
合併所有的authorized_keys文件,並同步到所有伺服器節點上。 2 安裝Hadoop
2.1 解壓 Hadoop tar包
$tar -xzf hadoop-1.1.0.tar.gz
2.2 設置Hadoop 環境變量
$vi /etc/profile
增加以下環境變量
export HADOOP_HOME=/home/hd/hadoop/hadoop-1.1.0
export PATH=$PATH:$HADOOP_HOME/bin
生效修改
$source /etc/profile
2.3 修改Hadoop 的配置文件
2.3.1 配置conf/core-site.xml文件
a) fs.default.name 是NameNode 的URI 。hdfs://主機名:埠/
b) hadoop.tmp.dir :Hadoop 的默認臨時路徑,這個最好配置,如果在新增節點或者其他情
況下莫名其妙的DataNode 啓動不了,就刪除此文件中的tmp 目錄即可。不過如果刪除了NameNode 機器的此目錄,那麼就需要重新執行NameNode 格式化的命令。
2.3.2 配置conf/mapred-site.xml文件
2.3.3 配置conf/ hdfs-site.xml文件
a) dfs.name.dir 是NameNode 持久存儲名字空間及事務日誌的本地文件系統路徑。 當這個值
是一個逗號分割的目錄列表時,nametable 數據將會被複製到所有目錄中做冗餘備份。 b) dfs.data.dir 是DataNode 存放塊數據的本地文件系統路徑,逗號分割的列表。 當這個值是
逗號分割的目錄列表時,數據將被存儲在所有目錄下,不用於Namenode 的冗餘機制,Datanode 將輪詢地存儲數據,所以講Datanode 的不同路徑分布在不同的物理硬碟上將提升性能。
c) dfs.replication 是數據需要備份的數量,默認是3,如果此數大於集羣的機器數會出錯。 d) name1、name2、data1、data2目錄不能預先創建,hadoop 格式化時會自動創建。
2.3.4 配置conf/hadoop-env.sh文件
增加JA V A_HOME環境變量
2.3.5 配置masters 文件
配置SecondaryNameNode ,也可以配置成自己
$vi masters
其中namenode 是master 伺服器主機名
2.3.6 配置slaves 文件
$vi slaves
其中node1-8爲datanode 伺服器主機名
2.4 啓動Hadoop
2.4.1 格式化NameNode
$./bin/hadoop namenode –format
格式化成功後在hdfs-site.xml 中配置的/home/hd/hadoop/name1和/home/hd/hadoop/name2兩個目錄會自動生成。
2.4.2 啓動Hadoop
$./bin/start-all.sh
啓動成功後在hdfs-site.xml 中配置的/home/hd/hadoop/data1和/home/hd/hadoop/data2兩個目錄會自動生成。
2.4.3 查看WEB 頁面
NameNode -
JobTracker -
3 安裝HBase
3.1 解壓HBase tar包
$tar –xvf hbase-0.94.1.tar.gz
3.2 設置Hbase 的環境變量
$vi /etc/profile
增加以下環境變量
export HBASE_HOME=/home/hd/hbase/hbase-0.94.1
export PATH=$PATH:$HBASE_HOME/bin
生效修改
$source /etc/profile
3.3 修改HBase 的配置文件
3.3.1 配置conf/hbase-site.xml文件
a) hbase.rootdir 是Hbase 的根目錄位置url 地址需要跟Hadoop 設置的一致。該項不識別機器
IP ,只能使用hostname
b) hbase.cluster.distributed 是是否採用分布式模式。
c) hbase.zookeeper.quorum 是運行Zookeeper 節點的主機名,個數必須爲奇數。
3.3.2 配置hbase-env.sh 文件
a) HBASE_MANAGES_ZK是設置是否讓Hbase 管理Zookeeper
3.3.3 配置regionservers 文件
3.4 啓動Hbase
$./bin/stat-hbase.sh
3.4.1 查看WEB 頁面
HBase Master -
4 安裝Hive
4.1 解壓hive tar包
$tar –xvf hive-0.9.0.tar.gz
4.2 配置環境變量
$vi /etc/profile
export HIVE_HOME=/home/hd/hive/hive-0.9.0
export PATH=$PATH:$HIVE_HOME/bin
4.3 進入命令行
$./bin/hive
4.4 使用Mysql 管理Hive 元數據
4.4.1 配置Mysql
使用root 用戶登錄mysql
$mysql -u root –p
創建hive 用戶
create user hive;
create database hivedb;
給hive 用戶賦權限
grant all on *.* to 'hive'@'%' identified by 'hive';
4.4.2 配置
conf/hive-site.xml
5 使用JPS 查看進程
解答:
- 上一篇 磁控電源
- 下一篇 有什麼數據恢復軟體好用?_圖文
評論已關閉