`
tangjunliang
  • 浏览: 107000 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

oozie的安装和部署

阅读更多
     在Hadoop中执行的任务有时候需要把多个Map/Reduce作业连接到一起,这样才能够达到目的。在Hadoop生态圈中,有一种相对比较新的组件叫做Oozie,它让我们可以把多个Map/Reduce作业组合到一个逻辑工作单元中,从而完成更大型的任务。
     Oozie是一种Java Web应用程序,它运行在Java servlet容器——即Tomcat——中,并使用数据库来存储以下内容:

     a. 工作流定义
     b. 当前运行的工作流实例,包括实例的状态和变量

     Oozie工作流是放置在控制依赖DAG(有向无环图 Direct Acyclic Graph)中的一组动作(例如,Hadoop的Map/Reduce作业、Pig作业等),其中指定了动作执行的顺序。我们会使用hPDL(一种XML流程定义语言)来描述这个图。
   
     以上只是oozie的一个简单的介绍,具体的可以参看oozie的官方网站。本文将阐述oozie的具体安装过程。PS: 本安装的oozie的版本为cloudera CDH4, hadoop版本也是CDH4

     1、下载
     wget http://archive.cloudera.com/cdh4/cdh/4/oozie-3.3.2-cdh4.3.0.tar.gz

     下载ext-2.2.zip

     2、tar zxvf oozie-3.3.2-cdh4.3.0.tar.gz 解压到你的目录下
        设置环境变量:vi ~/.bashrc 
        添加   export OOZIE_HOME=
              export PATH= $OOZIE_HOME/bin
              export OOZIE_URL=http://IP:11000/oozie
          执行source ~/.bashrc

     3、进入conf/action-conf,修改hive.xml(如果需要支持hive的话),修改如下:

   <property>
      <name>hadoop.bin.path</name>
      <value>hadoop安装目录/bin/hadoop</value>
   </property>

   <property>
      <name>hadoop.config.dir</name>
      <value>hadoop安装目录/etc/hadoop</value>
   </property>
     
     修改conf/oozie-env.sh,配置你自己的参数值
    
     修改conf/oozie-site.xml
     如果使用的是mysql的话,则修改以下配置
     <property>
        <name>oozie.service.JPAService.jdbc.driver</name>
        <value>com.mysql.jdbc.Driver</value>
        <description>
            JDBC driver class.
        </description>
    </property>

    <property>
        <name>oozie.service.JPAService.jdbc.url</name>
        <value>jdbc:mysql://你的IP:3306/${oozie.db.schema.name}?      useUnicode=true&amp;characterEncoding=utf8</value>
        <description>
            JDBC URL.
        </description>
    </property>

        <property>
        <name>oozie.service.JPAService.jdbc.username</name>
        <value>用户</value>
        <description>
            DB user name.
        </description>
    </property>

    <property>
        <name>oozie.service.JPAService.jdbc.password</name>
        <value>密码</value>
        <description>
            DB user password.

            IMPORTANT: if password is emtpy leave a 1 space string, the service trims the value,
                       if empty Configuration assumes it is NULL.
        </description>
    </property>
    
    4、解压oozie-hadooplibs-3.3.2-cdh4.3.0.tar.gz,在oozie的主目录下生成oozie-3.3.2-cdh4.3.0目录,在oozie主目录下创建libext目录,把刚才解压的目录下的文件,我的是oozie/oozie-3.3.2-cdh4.3.0/hadooplibs/hadooplib-2.0.0-cdh4.3.0.oozie-3.3.2-cdh4.3.0下的jar包拷贝到libext目录下;再把ext-2.2.zip和mysql的驱动包拷贝到libext目录下。

    5、执行bin/oozie-setup.sh prepare-war -hadoop 2.x hadoop安装目录 -extjs ext-2.2.zip路径 这样在oozie-server/webapps目录下将会生成一个oozie.war文件,刚才的ext-2.2也包含在里面了,用于oozie控制台。

    6、解压oozie-sharelib-3.3.2-cdh4.3.0.tar.gz,在oozie主目录下生成share文件夹,拷贝mysql驱动包到该目录下的lib/hive中(hive会用到),然后把lib下的文件拷到到HDFS的目录/user/${user.name}/share/lib下。

    7、在mysql上创建oozie库,执行bin/ooziedb.sh create -sqlfile oozie.sql -run DB Connection 这样将会在oozie库中创建oozie运行需要的表。

    8、执行bin/oozie-start.sh 启动oozie,web控制台访问地址为http://IP:11000/oozie
       通过bin/oozie admin -oozie http://localhost:11000/oozie -status这个命令可以查看oozie的状态













    
0
1
分享到:
评论

相关推荐

    Oozie安装部署及任务定义说明

    Oozie 部署 1 1、Maven 安装 1 3、整合Oozie和Hadoop 8 Oozie提交MapReduce任务事例 8 1上传lib和wf到hdfs上 8 2修改job.properties文件 8 3:修改workflow.xml 9 4:执行oozie客户端命令执行mapreduce 10 配置oozie...

    快速学习-Oozie的部署

    第3章 Oozie的部署 3.1 部署Hadoop(CDH版本的) 3.1.2 修改Hadoop配置 core-site.xml hadoop.proxyuser.atguigu.hosts * hadoop.proxyuser.atguigu.groups * mapred-site.xml mapreduce.jobhistory....

    Hadoop+Spark+Hive+HBase+Oozie+Kafka+Flume+Flink+ES+Redash等详细安装部署

    5、资源价值:大数据组件搭建的详细实践步骤、一次性提供较全面的常用大数据集群及组件安装部署内容、资源是博主结合官网文档+网上各类搭建文档+本人亲自实践后总结整合的文档(包括过程踩坑记录+对应解决方案)。

    Oozie大数据调度系统从入门到精通视频教程

    7.Oozie的部署配置 第三章:Oozie调度开发实战 1.Shell脚本工作流调度开发实战 2.Hive Job工作流调度开发实战 3.MapReduce工作流调度开发实战 4.复杂工作流调度实战 5.分支与合并逻辑控制组件 第四章:...

    Oozie安装教程

    格式化集群并启动二、部署oozie1.上传安装包2.解压3.集成jar包4.修改oozie的配置文件4.1JDBC驱动包4.2jdbc url4.3数据库用户名4.4数据库密码5.在MySQL中创建数据库6.初始化oozie7.启动 本人在安装oozie的

    安装Oozie4.1.0-CDH版本

    安装Oozie4.1.0-CDH版本 这个安装过程同样适用于oozie4.1.0的其他的CDH版本。 先对文件进行下载: 这里使用的是CDH版本的,免编译,看着编译的过程就够了。下载地址: ...

    2018最新高清大数据协作框架全套视频教程(Sqoop,Flume,Oozie,WEB工具Hue)

    第1章 数据转换工具Sqoop 1.02_02_01_01 大数据Hadoop 2.x协作.框架的功能 网页.mp4 1.02_02_01_02 Sqoop 功能概述和版本、架构讲解 网页.mp4 1.02_02_01_03 Sqoop 使用...3.02_02_03_05 Oozie安装部署讲解一 网页.mp4

    slippin-jimmy:实用程序在AWS EMR上构建和部署oozie工作流

    该模块当前是针对Oracle Client 11.2、12.1和12.2构建的,并且它是安装Oracle Instanclient的操作所必需的。 您可以在以下位置查看如何安装它: : 或 for conda环境用户。 运行脚本 在脚本执行过程中会要求提供未...

    hdp集群从0到1搭建

    3.8 部署Oozie 3.9 部署Ranger 3.10 部署Sqoop 3.11 部署 DataX 3.12 部署Azkaban 3.13 部署Presto 3.14 部署Elasticsearch 3.15 卸载Ambari集群 3.16 故障排除 二 hadoop技术验证(鲲鹏) 1 数据同步性能(sqoop\...

    小白快速掌握CDH的安装和配置视频教程

    1,Cloudera Manager可视化、自动部署和配置,稳定性好 2,理论+操作,培养解决实际问题的能力。 3,涉及到大数据离线和实时主流服务安装。 适用人群 1、对大数据感兴趣的在校生及应届毕业生。 2、对目前职业有...

    win10下搭建Hadoop环境(jdk+mysql+hadoop+scala+hive+spark) 3.docx

    win10下搭建Hadoop(jdk+mysql+hadoop+scala+hive+spark),包括jdk的安装、mysql安装和配置,hadoop安装和配置,scala安装和配置,hive安装和配置,spark安装和配置。

    Cloudera Hadoop 5&amp;Hadoop高阶管理及调优课程

    Cloudera Hadoop 5&Hadoop高阶管理及调优课程,完整版,提供课件代码资料下载。 内容简介 ...3、Impala、Oozie和Hue的部署、使用操作及调优 4、Hadoop安全认证及授权管理 5、Hadoop各组件性能调优

    1、azkaban介绍、三种(solo-server、two-server和multiple-executor)部署方式及验证

    1、azkaban介绍、三种(solo-server、two-server和multiple-executor)部署方式及验证 网址:https://blog.csdn.net/chenwewi520feng/article/details/130728956 介绍阿兹卡班的主要功能、应用场景以及三种部署方式...

    cloudify-cloudera:用于部署和配置 cloudera 集群的 Cloudify 脚本,以及各种 cloudera 服务(HDFS、MapReduce、Hue、Zookeeper、Oozie 等)

    云朵 类型:应用状态:已测试描述:cloudera 配方 1.0.0 维护者:Fastconnect 维护者邮箱: 贡献者:主页: 许可证:Apache 2.0 构建: Linux sudoer 权限... 部署和配置 cloudera 集群,包括可选的 MongoDB 集群和 MySQL

    Spark的Shuffle总结分析

    Shuffle就是对数据进行重组,由于分布式计算的特性和要求,在实现细节上更加繁琐和复杂。 在MapReduce框架,Shuffle是连接Map和Reduce之间的桥梁,Map阶段通过shuffle读取数据并输出到对应的Reduce,而Reduce阶段...

    Apache Hue 2小时轻松搞定大数据可视化终端视频教程

    第二章:Hue的定制化编译与部署 1.Hue的依赖环境构建 2.Hue基础配置更改 3.Hue定制化编译 4.Hue的安装及服务管理详解 第三章:Hue与Hadoop及Hive集成 1.Hue配置集成Hadoop 2.Hadoop配置代理用户 3.Hue...

    价值上万的视频教程互联网程序开发+大数据+Hadoop、hive、Spark

    lg大数据高薪训练营 ...· 安装部署 · RDD概述 · 编程模型 · 持久化&检查点机制 · DAG · 算子详解 · RDD编程进阶 · 累加器&广播变量 Spark SQL · SparkSQL · DataFrame · DataSet · 自定义

    编译好的azkaban,3.90.0版本

    azkaban源码安装由于国内网络等各种原因踩了很多坑,终于编译好了,可下载修改配置就可以直接使用了。

    大数据平台简介.pptx

    Hadoop生态系统 Ambari (安装部署工具) Zookeeper (分布式协调服务) HBase (分布式协数据库) Oozie (作业流调度系统) HDFS (分布式存储系统) YARN (分布式计算框架) MapReduce (离线计算) Tez (DAG...

    大数据开源框架集锦.pdf

    配置和监控Hadoop以及其它所有相关组件 简单来说将⼗⼏个hadoop开源项⽬集成在⼀起 HDP 基于hadoop⽣态系统开源组件构建的⼤数据分析平台 2 集群管理与监控 Cloudera Manager ⽤于部署和管理CDH集群的软件 ...

Global site tag (gtag.js) - Google Analytics