2014第一篇博文,将来也会逐步写成一个系列,新年新气象。

将hadoop及其周边生态系统deb/rpm化对于自动化运维来说意义重大,建立好整个生态的rpm和deb然后再创建本地yum或者apt的源,可大大简化hadoop的部署和运维。实际上,cloudera和hortonworks都是这么做的。

本来想把rpm和deb都写了,不过估计篇幅不够,还是分开吧,先从deb讲起。deb创建比较容易一些,不需要写什么spec脚本。

以hadoop 2.2.0为例,apache官方并不提供基于2.0的rpm和deb,所以我们自己想法去创建自己的修改过的rpm和deb。

一、先下载hadoop编译后的包,大概100多兆,然后解压缩

#wget http://mirrors.cnnic.cn/apache/hadoop/common/hadoop-2.2.0/hadoop-2.2.0.tar.gz
#tar zxf hadoop-2.2.0.tar.gz

二、创建打包需要的文件夹

#mkdir -p /opt/hadoop_2.2.0-1_amd64/DEBIAN
#mkdir -p /opt/hadoop_2.2.0-1_amd64/usr
#mkdir -p /opt/hadoop_2.2.0-1_amd64/etc

其中DEBIAN是放置打包脚本用的,usr和etc是将来打包后将会安装到的路径。最后打包完成后,这里的usr目录对应的就是未来linux系统里面的/usr目录,etc目录对应的就是linux系统的/etc目录。

三、将hadoop里面的东西复制到目的文件夹

第一步解压缩后的hadoop-2.2.0文件夹下应该有如下一些文件夹。
-bin
-etc
–|-hadoop
-sbin
-share
-lib
-libexec
-include
原始tar包里面的hadoop大概的文件夹结构大概是这样的。然后执行复制。

#tar zxf hadoop-2.2.0.tar.gz
#cd hadoop-2.2.0
#cp -rf bin sbin lib libexec share include /opt/hadoop_2.2.0-1_amd64/usr/
#cp -rf etc/hadoop /opt/hadoop_2.2.0-1_amd64/etc/

复制后的打包文件夹/opt/hadoop_2.2.0-1_amd64/目录结构应大致如下
-DEBIAN
-etc
–|-hadoop
-usr
–|-bin
–|-sbin
–|-include
–|-lib
–|-libexec
–|-share
然后开始编写DEBIAN文件夹下的控制文件,ubuntu和debian打包相对rpm简单一些,只需要写几个独立的脚本文件即可。
进入DEBIAN文件夹,先编辑元数据文件control

#cd /opt/hadoop_2.2.0-1_amd64/DEBIAN
#vi control

输入以下内容

Package: hadoop
Version: 2.2.0-GA
Section: misc
Priority: optional
Architecture: amd64
Provides: hadoop
Maintainer: Xianglei
Description: The Apache Hadoop project develops open-source software for reliable, scalable, distributed computing.

保存退出,然后编辑同目录下的conffile,用来监视安装后配置文件的变化,以在卸载的时候保留更改后的配置文件。

#vi /opt/hadoop_2.2.0-1_amd64/DEBIAN/conffile

输入以下内容

/etc/hadoop/core-site.xml
/etc/hadoop/hdfs-site.xml
/etc/hadoop/mapred-site.xml
/etc/hadoop/yarn-site.xml
/etc/hadoop/hadoop-env.sh
/etc/hadoop/yarn-env.sh

继续。还有四个控制文件需要编辑,分别是postinst安装后操作,postrm删除前操作,preinst安装前操作,prerm删除前操作,都是以脚本的形式来编写。放一起写。

#vi postinst
#------
mkdir -p /usr/etc
ln -s /etc/hadoop /usr/etc/hadoop
rm -f /etc/hadoop/hadoop
#------
#vi postrm
#------
/usr/sbin/userdel hdfs 2> /dev/null >/dev/null
/usr/sbin/userdel mapred 2> /dev/null >/dev/null
/usr/sbin/groupdel hadoop 2> /dev/null >dev/null
exit 0
#------
#vi preinst
#------
getent group hadoop 2>/dev/null >/dev/null || /usr/sbin/groupadd -g 123 -r hadoop
/usr/sbin/useradd --comment "Hadoop MapReduce" -u 202 --shell /bin/bash -M -r --groups hadoop --home /var/lib/hadoop/mapred mapred 2> /dev/null || :
/usr/sbin/useradd --comment "Hadoop HDFS" -u 201 --shell /bin/bash -M -r --groups hadoop --home /var/lib/hadoop/hdfs hdfs 2> /dev/null || :
#------
#vi prerm
#------
#不写内容,空即可
#------

这时候基本就完事了,当然,你还需要修改一下hadoop脚本里面的路径输出配置,以适应打包安装后的路径。这个就很简单了,没啥可说的了。
然后在shell里面执行

#cd /opt
#dpkg -b hadoop_2.2.0-1_amd64

然后你将会得到hadoop_2.2.0-1_amd64.deb安装包。用dpkg -i 命令安装试试吧。做饭吃去了,下一次说做apt源和rpm包的办法。

发表评论

*
*

Required fields are marked *