Advertisement

DolphinScheduler任务调度系统——其他分类

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:ZIP


简介:
DolphinScheduler是一款功能强大的分布式工作流任务调度平台,适用于企业级数据处理和业务流程自动化。它支持复杂的依赖关系、丰富的插件机制及灵活的任务管理界面,帮助企业高效运行各类批处理作业,提升运营效率与服务质量。 Apache DolphinScheduler(原名EasyScheduler)是一个大数据分布式工作流任务调度系统,旨在解决在大数据开发过程中ETL处理复杂的依赖关系,并且不能实时监控任务健康状态的问题。DolphinScheduler采用DAG图的方式将Task组织起来,能够实时监控任务运行状况,并支持重试、从指定节点恢复失败的任务、暂停及终止操作等功能。 该系统的特性包括: 1. 以分布式和易扩展的可视化方式呈现DAG工作流。 2. 支持多种类型的任务:Shell脚本、MR(MapReduce)、Spark作业、SQL(MySQL, PostgreSQL, Hive, Spark SQL),Python脚本,子进程等。 3. 提供定时调度、依赖关系触发调度、手动启动/停止任务以及失败重试和告警功能。还支持从指定节点恢复故障及终止运行的任务等功能。 4. 支持为工作流设置优先级,并可以处理任务的故障转移及超时告警等问题。 5. 允许设定全局参数与特定节点上的自定义参数。 6. 提供资源文件上传、下载和管理功能,包括在线创建和编辑等操作。 7. 使用户能够在线查看并滚动日志以及下载日志内容。 8. 实现了集群的高可用性配置,通过Zookeeper实现主从服务器与工作节点之间的去中心化架构。 9. 可以实时监控MasterWorker CPU负载、内存使用情况和CPU状态等信息。 10. 提供甘特图展示历史运行数据,并支持任务及流程的状态统计功能。 11. 支持补数操作,确保数据完整性。 12. 实现多租户环境下的资源隔离与管理机制。 13. 系统具备国际化语言的支持能力。 此外,DolphinScheduler还有许多其他特性等待开发者们进一步探索。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • DolphinScheduler——
    优质
    DolphinScheduler是一款功能强大的分布式工作流任务调度平台,适用于企业级数据处理和业务流程自动化。它支持复杂的依赖关系、丰富的插件机制及灵活的任务管理界面,帮助企业高效运行各类批处理作业,提升运营效率与服务质量。 Apache DolphinScheduler(原名EasyScheduler)是一个大数据分布式工作流任务调度系统,旨在解决在大数据开发过程中ETL处理复杂的依赖关系,并且不能实时监控任务健康状态的问题。DolphinScheduler采用DAG图的方式将Task组织起来,能够实时监控任务运行状况,并支持重试、从指定节点恢复失败的任务、暂停及终止操作等功能。 该系统的特性包括: 1. 以分布式和易扩展的可视化方式呈现DAG工作流。 2. 支持多种类型的任务:Shell脚本、MR(MapReduce)、Spark作业、SQL(MySQL, PostgreSQL, Hive, Spark SQL),Python脚本,子进程等。 3. 提供定时调度、依赖关系触发调度、手动启动/停止任务以及失败重试和告警功能。还支持从指定节点恢复故障及终止运行的任务等功能。 4. 支持为工作流设置优先级,并可以处理任务的故障转移及超时告警等问题。 5. 允许设定全局参数与特定节点上的自定义参数。 6. 提供资源文件上传、下载和管理功能,包括在线创建和编辑等操作。 7. 使用户能够在线查看并滚动日志以及下载日志内容。 8. 实现了集群的高可用性配置,通过Zookeeper实现主从服务器与工作节点之间的去中心化架构。 9. 可以实时监控MasterWorker CPU负载、内存使用情况和CPU状态等信息。 10. 提供甘特图展示历史运行数据,并支持任务及流程的状态统计功能。 11. 支持补数操作,确保数据完整性。 12. 实现多租户环境下的资源隔离与管理机制。 13. 系统具备国际化语言的支持能力。 此外,DolphinScheduler还有许多其他特性等待开发者们进一步探索。
  • DolphinScheduler v1.3.3
    优质
    DolphinScheduler是一款功能强大的分布式任务调度平台,v1.3.3版本提供了可视化的任务管理、可靠的执行控制及丰富的监控报警功能。 DolphinScheduler 是一个大数据分布式工作流任务调度系统(原名EasyScheduler),由 Apache 育成项目支持。该系统旨在解决在大数据研发过程中遇到的ETL处理依赖关系复杂、无法直观监控任务健康状态等问题。通过使用 DAG 流式方式,DolphinScheduler 可以将 Task 组装起来,并实时监控其运行状态。此外,它还提供了重试、从指定节点恢复失败的任务以及暂停和终止任务等操作的支持。
  • XXL-JOB布式-
    优质
    XXL-JOB是一款轻量级分布式任务调度系统,提供web管理界面,支持任务创建、维护及在线动态调度等功能,适用于Linux和Windows环境。 XXL-JOB是一个轻量级的分布式任务调度平台,设计旨在快速开发、易于学习且具备扩展性。该系统已经开源,并被多家公司用于线上产品中。 XXL-JOB的主要特点包括: 1. 简单:用户可以通过Web页面进行任务管理(创建、读取、更新和删除),操作简便,一分钟内即可上手。 2. 动态:支持动态修改任务状态及启动/停止功能,并可即时终止正在运行的任务。 3. 高可用调度中心设计:调度中心采用自研组件并能集群部署以保证高可用性。 4. 执行器的分布式处理能力:“执行器”可以集群部署,确保任务执行的高可靠性。 5. 注册机制:执行器会定期自动向“调度中心”注册自身信息,“调度中心”则根据这些信息来触发相应的任务。同时支持手动录入执行器地址。 6. 弹性扩展:如果新的执行器加入或离开系统,在下一次调度时,任务会被重新分配到现有的执行器中运行。 7. 路由策略:提供多种路由策略以适应不同的应用场景,包括但不限于第一个、最后一个、轮询等模式。 8. 故障转移机制:当选择“故障转移”作为任务的路由策略时,在某台执行器出现故障的情况下,调度请求会被自动转移到其他健康的执行器上继续运行。 9. 阻塞处理策略:在高负载情况下提供多种策略来保证系统的稳定性和性能。默认单机串行模式下,系统会等待当前任务完成后再启动下一个任务;也可以选择丢弃后续的调度或覆盖之前的调度请求。 10. 任务超时控制机制:允许设置自定义的任务执行时间限制,在达到设定的时间后将自动终止任务以防止长时间占用资源。 11. 失败重试功能:支持为每个任务单独配置失败后的重试次数,当遇到错误时系统会按照预设的次数进行自动重试。对于分片类型的任务也提供了粒度级别的失败处理策略。 12. 任务失败告警机制:默认通过邮件发送通知给相关人员,在此基础上还预留了接口用于扩展短信或钉钉等其他形式的通知方式。 13. 分布式执行模式:“分片广播”是一种特殊的路由策略,它会将一个调度请求同时传递到所有的执行器实例上进行处理。这种方式非常适合大数据量的业务场景中使用以提高整体性能和效率。 14. 动态调整分片数量:允许根据实际需求灵活地增加或减少参与任务处理的服务节点数(即“执行器”),从而动态改变每份数据的工作负载分配,进而改善系统响应时间和吞吐量。 15. 事件触发机制:除了定时调度之外,还支持基于特定业务逻辑的即时调度。通过提供API接口允许用户灵活地控制何时何地启动任务运行。 16. 进度监控功能:可以实时跟踪各个任务的状态和进度情况。 17. 实时日志查看器:“Rolling”模式下能够在线滚动显示执行过程中的完整输出信息,便于调试问题或审计历史操作记录。 18. 在线代码编辑器(GLUE):提供一个Web IDE用于开发、测试以及发布新版本的任务逻辑。支持回溯到前30个版本的历史代码进行对比分析和恢复工作。 19. 脚本任务执行模式:除了传统的Java Bean方式之外,还允许使用各种脚本语言编写并运行相应的作业程序(如Shell, Python等)。 20. 命令行任务处理器:提供了一种简单的方式让用户通过命令行输入来定义和调度复杂的业务逻辑流程。 21. 依赖关系管理功能:支持设置父子层级的任务关联规则,当父级完成且成功时可以自动触发子级的执行。多个子任务可以通过逗号进行分隔以表示它们之间的并行或串行顺序。 22. 数据一致性保证:“调度中心”使用数据库锁机制确保在分布式环境下的一致性操作,即任何给定的任务只会在一个节点上被执行一次。 23. 自定义参数配置:可以在Web界面中为每个任务单独设置输入参数,并且这些更改会立即生效而无需重启服务。 24. 调度线程池管理机制:通过多线程模型来触发和执行调度操作,以确保定时作业能够按时准确地运行并避免被阻塞。 25. 数据加密传输保护措施:在“调度中心”与各个执行器之间通信时采用数据加密技术增强信息的安全性。 26. 邮件报警功能:当任务失败后可以发送邮件通知给指定的收件人地址列表,便于及时发现和处理问题。 27. Maven仓库集成能力:最新的稳定版本会被推送到Maven中央库中
  • DolphinScheduler: 新一代布式大数据工作流的源码解析
    优质
    《DolphinScheduler: 新一代分布式大数据工作流任务调度系统的源码解析》一书深入剖析了DolphinScheduler的设计理念与实现细节,帮助读者掌握其核心功能和优化技巧。 本课程专注于新一代分布式大数据工作流任务调度系统DolphinScheduler的源码分析。2021年8月推出的新课将深入讲解DolphinScheduler框架的设计思想和技术细节,并按照模块对大量源代码进行解析,帮助学员不仅掌握该系统的使用方法,还能学习到许多优秀的设计思路和技巧,为技术提升和个人职业发展打下坚实基础。
  • JFinalOA办公——
    优质
    JFinalOA是一款基于JFinal框架开发的企业级办公自动化系统,提供邮件管理、日程安排和文档协作等多功能服务,帮助企业提升内部沟通与工作效率。 JFinalOA 是基于 JFinal 框架开发的企业办公系统。使用的技术包括:JFinal 4.6、enjoy模板引擎、Shiro 控制权限、Flowable 流程引擎以及 Bootstrap 和 MySQL。 主要模块有: - 菜单管理 - 用户管理 - 组织结构管理 - 角色管理 - 正在运行的流程查看与操作 - 流程模型管理 - 用章申请(作为流程示例) - 通知公告发布 系统还支持自定义皮肤功能。
  • OASYS办公-
    优质
    OASYS办公系统是一款集成了多种高效工具和资源的一站式办公软件,适用于各类企业的日常管理与运营需求。尽管被归类为“其他”,它却提供了包括文档编辑、项目管理和团队协作在内的全面解决方案。 OASYS是一个OA办公自动化系统,使用Maven进行项目管理,并基于Spring Boot框架开发。该项目采用MySQL作为底层数据库,前端则利用Freemarker模板引擎与Bootstrap作为UI框架构建而成,集成了JPA、MyBatis等技术栈。 对于刚开始学习Spring Boot的开发者而言,OASYS是一个很好的实践案例;同时,它也为有志于在此基础上进一步增强OA功能的人们提供了良好的起点。以下是部署步骤: 1. 下载项目,并将oasys.sql文件导入到本地数据库中。 2. 修改`application.properties`配置文件。 3. 更改数据源设置:将“oasys”修改为自己的库名,同时更新用户名和密码为自己使用的值。 4. 调整相关路径的设定,包括图片、文件及附件路径。注意要确保在指定位置放置了如static/image/oasys.jpg这样的示例图片以避免出现`FileNotFoundException`错误。 5. 在OasysApplication.java类中的main方法运行项目。如果控制台无报错信息,则说明启动成功且加载时间即为完成部署的时间长度。 6. 最后,在浏览器地址栏输入“localhost:8088/logins”访问登录页面。 测试账号包括: - 用户名:test,密码:test - 用户名:soli, 密码:123456
  • DolphinScheduler 海豚器的动态执行参数传递
    优质
    本篇介绍如何在 DolphinScheduler 中灵活地为动态任务分配执行参数,通过配置和使用方法详解,帮助用户实现高效的任务自动化与管理。 ### DolphinScheduler 海豚调度器动态传递任务执行参数 #### 一、重要性及应用场景 **DolphinScheduler(简称DS)** 是一款强大的分布式任务调度平台,支持多种类型的作业执行,如Shell、Python、Spark等。它能够高效地管理任务间的依赖关系,并提供了丰富的功能来满足企业级的数据处理需求。在大数据领域,特别是对于需要频繁执行批处理任务的场景来说,动态传参的功能显得尤为重要。 #### 二、动态传参的核心价值 动态传参是DS的一项关键特性,它允许用户在任务流中灵活地传递变量值,这对于批量补采数据或自动化执行一系列作业非常有用。例如,在需要对不同日期的数据进行处理时,可以通过设置一个全局参数来控制所有任务中的日期变量,而无需逐个修改每个任务节点的配置。 #### 三、使用方法详解 ##### 1. **基本概念** - **自定义OUT参数**:这是实现动态传参的基础。通过在任务节点中定义一个OUT参数,可以将其作为输出传递给下一个任务节点。 - `${setValue(key=$value)}`:这个命令用于设置自定义OUT参数的值,其中`key`表示参数名,`$value`表示参数值。 - `${value}`:用于在下游任务中引用前一任务传递过来的参数值。 ##### 2. **操作步骤** - **步骤1**:在第一个任务节点中定义并设置OUT参数。例如,在任务节点111中,我们定义了一个名为`date_str1`的OUT参数,并将其设置为当前日期的前一天。 ```bash data_str=`date -d 0 days ago +%Y%m%d` echo ${setValue(date_str1=$data_str)} ``` - **步骤2**:在下游任务节点中接收并使用这些参数。例如,在任务节点222中,我们首先打印出从上游节点传递过来的`date_str1`参数值,然后再将其设置为新的OUT参数`date_str2`。 ```bash echo ${date_str1} date_str=${date_str1} echo ${setValue(date_str2=$date_str)} ``` - **步骤3**:继续在后续任务节点中传递或使用参数。例如,在任务节点333中,我们可以直接打印出从任务节点222传递过来的`date_str2`参数值。 ```bash echo ${date_str2} ``` ##### 3. **注意事项** - 当需要向下一级传递动态参数时才使用自定义OUT参数,否则不需要。 - 设置的传递变量参数在所有需要调用的任务节点中必须唯一,避免混淆。 #### 四、实战案例 为了更好地理解动态传参的实现过程,下面提供了一个完整的示例: 1. **任务节点111** - **脚本内容**: ```bash data_str=`date -d 0 days ago +%Y%m%d` echo ${setValue(date_str1=$data_str)} ``` - **自定义参数**:`date_str1OUTVARCHAR` 2. **任务节点222** - **脚本内容**: ```bash echo ${date_str1} date_str=${date_str1} echo ${setValue(date_str2=$date_str)} ``` - **自定义参数**:`date_str2OUTVARCHAR` 3. **任务节点333** - **脚本内容**: ```bash echo ${date_str2} ``` #### 五、总结 通过上述示例可以看出,DolphinScheduler的动态传参功能极大地方便了批量数据处理任务的自动化执行,减少了人工干预的需求。对于需要频繁进行补采数据的场景来说,这一特性无疑是一个极大的生产力提升工具。开发者只需在任务流的入口处设置好参数,即可轻松实现参数在整个流程中的传递,极大地简化了开发与运维的工作流程。
  • xxl-job布式 v2.2.0
    优质
    XXL-JOB是一款基于Java开发的企业级分布式任务调度平台,v2.2.0版本提供了包括在线配置管理、动态执行等功能,帮助企业高效灵活地管理和运行各类定时任务。 XXL-JOB是一个轻量级的分布式任务调度平台,其核心设计目标是快速开发、易于学习、轻便且可扩展性强。该平台已开放源代码,并被多家公司的线上产品线采用,即插即用。 以下是XXL-JOB的主要特点: 1. 简单:支持通过Web页面对任务进行创建、读取、更新和删除操作,使用方便,一分钟内即可上手; 2. 动态:提供动态修改任务状态及启动或停止任务的功能,并可立即终止运行中的任务,即时生效; 3. 调度中心HA(中心式):调度采用集中式的架构设计,“调度中心”自研了相应的调度组件并支持集群部署。
  • RuoYi-plus后台管理——
    优质
    RuoYi-plus是一款基于Spring Boot框架的高效后台管理系统,提供了丰富的功能模块和灵活的权限控制机制。 RuoYi-plus是一个基于RuoYi升级的Spring Cloud版本管理系统。该软件由SMP多商户后台管理系统与API后端接口组成,支持CMS内容管理和商城业务,并提供单机版服务及微服务体系双向选择。在微服务集成方面,它采用了Seata作为分布式事务解决方案,并且框架基于SpringBoot2.x和springcloud G版本的Eureka、Hystrix、Feign、Config和Gateway等技术。 项目核心包括多商户权限系统、商城平台以及CMS内容管理等功能;此外还集成了Redis缓存服务、Quartz定时任务调度器,使用了tk.mybatis及Lombok等相关工具库,并运用多种设计模式。RuoYi-plus的优势在于架构清晰、采用前沿的技术栈和整洁的代码风格,同时界面美观且易于学习与商用。 该项目适用于OA系统、CRM系统以及PDM系统的二次开发;对于微服务架构的学习也非常合适,可用于公司管理平台旧版本升级或新平台搭建快速整合,并提供API接口服务(如供APP、移动端及H5页面使用)。 RuoYi-plus内置的功能涵盖用户管理、部门配置、岗位设置等基础权限模块以及字典维护和参数动态配置等功能。除此之外还包含通知公告发布与操作日志记录查询,支持登录状态监控,并具备定时任务调度功能;同时提供代码生成器用于自动生成前后端接口及文档,并集成服务性能监视工具。 在商城业务方面,RuoYi-plus提供了商户管理、商品类别设置以及商品信息维护等功能模块。CMS内容方面则包括文章分类配置和素材图片/视频的上传与管理等基础功能;API接口部分涵盖业务处理微服务结构设计以解决分布式事务问题,并且具备订单及商品相关业务逻辑。 商用须知:本项目遵循MIT协议,无需授权使用,只需留言备注公司信息即可。演示账户为tecom, 密码123456。