azkaban-tools 项目介绍

文章结构

本文背景 -> 项目背景 -> azkaban 编译方式 -> jq 基本使用方法 -> 后记

本文背景

应一个用户的好心和好奇心，在最近水深火热的百忙之中抽时间写完了一个简短的项目介绍，项目代码不多，其实就是几个azkaban的批量操作脚本，但在大数据集群的“运维生涯”中，还是帮了自己不少忙的，也算是为了它做一个简单的回顾吧

项目背景

azkaban 是一个大数据领域通用的任务管理服务，它的运行模式和其他任务管理服务类似，都是将任务下发到执行器，定期执行，它的优势主要在于可定义任务流，同个项目下不同任务可引用同个模板，大数据领域的任务正好比较具有复用性，因此在 azkaban 诞生的时代（第一个release在2014年），它还是成为了当时比较流行的开源任务调度服务

azkaban 的操作方式比较容易上手，通过界面即可完成所有的操作，包括上传项目、执行项目中定义的job、查看job日志、给任务配置调度时间等，操作并不复杂。但如果需要批量做一些操作，在界面一个个点就不太方便了

之前没有做这个项目的时候，隔三差五用户就要来找我“能不能帮忙…”（具体对话参考下面），终于有一天没忍住，本项目就此诞生…

主要实现的批量操作场景如下：

批量操作① 启动任务

每年都会有个一两次的真实对话