文章 2024-11-12 来自:开发者社区

Apache Airflow 开源最顶级的分布式工作流平台

背景介绍 Apache Airflow(或简称Airflow)是一个以编程方式创作,计划和监视工作流的平台。 当工作流定义为代码时,它们将变得更加可维护、可版本控制、可测试和协作。 使用 Airflow 将工作流创作为任务的有向无环图 (DAG)。Airflow 调度程序在遵循指定的依赖项的同时,在一组工作线程上执行您的任务。丰富的命令行实用程序使在 DAG 上执行复杂的手术变得轻而易举。丰富的....

Apache Airflow 开源最顶级的分布式工作流平台
文章 2024-06-05 来自:开发者社区

使用Apache Airflow进行工作流编排:技术详解与实践

引言: 在现代数据处理和分析的领域中,工作流编排工具扮演着至关重要的角色。随着数据管道的复杂性不断增加,如何有效地管理和调度这些数据处理任务成为了一个挑战。Apache Airflow,作为一个强大的工作流编排平台,提供了一个简单而灵活的方式来定义、调度和监控数据工作流。本文将详细介绍Apache Airflow的基本概念、特...

文章 2023-01-05 来自:开发者社区

Apache Spark + 海豚调度:PB 级数据调度挑战,教你如何构建高效离线工作流

点击预约直播2010 年,我国进入移动互联网,数据规模成几何式增长。在大数据开源技术领域,以 Hadoop 为核心的大数据生态系统面对海量数据也不断发展与迭代,大数据处理流程中的各个开源组件,也一起开启了狂飙突进的大数据时代,推动了整个行业开启了数字化变革之路。近年来,大数据行业的开发者都在感慨:技术迭代更新速度的太快了,今年还在流行,明年就可能被雪藏!其实我们非常清楚,技术永远是在“更新”或“....

Apache Spark + 海豚调度:PB 级数据调度挑战,教你如何构建高效离线工作流
文章 2022-11-18 来自:开发者社区

Apache Oozie- 节点类型 (control flow. action) & 工作流类型 (coordinator. bundle)|学习笔记

开发者学堂课程【Oozie 知识精讲与实战演练: Apache Oozie- 节点类型 (control flow. action) & 工作流类型 (coordinator. bundle)】学习笔记,与课程紧密联系,让用户快速学习知识。  课程地址:https://developer.aliyun.com/learning/course/716/detail/12782Ap....

Apache Oozie- 节点类型 (control flow. action) & 工作流类型 (coordinator. bundle)|学习笔记
文章 2022-11-02 来自:开发者社区

如何将 Apache Airflow 用于机器学习工作流

使用执行器扩展 Apache AirflowApache Airflow 具有基于调度程序、工作节点、元数据数据库、Web 服务器和队列服务的多节点架构。使用 Airflow 时的首要选择之一是执行器的类型。 执行程序与调度程序通信,以便在每个任务排队时为其分配资源。 执行器之间的差异归结为他们可用的资源。Airflow 配置示例如下:网络异常,图片无法展示|顺序执行器默认执行器可以轻松地在本地....

如何将 Apache Airflow 用于机器学习工作流
文章 2021-11-17 来自:开发者社区

Apache DolphinScheduler 毕业成为 Apache 首个由国人主导的大数据工作流调度领域顶级项目

全球最大的开源软件基金会 Apache 软件基金会(以下简称 Apache)于北京时间 2021 年 4 月 9 日在官方渠道宣布 Apache DolphinScheduler 毕业成为 Apache 顶级项目。这是首个由国人主导并贡献到 Apache 的大数据工作流调度领域的顶级项目。DolphinScheduler™ 已经是联通、IDG、IBM、京东物流、联想、新东方、诺基亚、360、顺丰....

Apache DolphinScheduler 毕业成为 Apache 首个由国人主导的大数据工作流调度领域顶级项目
文章 2017-05-02 来自:开发者社区

Apache Spark机器学习.1.7 机器学习工作流示例

1.7 机器学习工作流示例 为了进一步了解学习机器学习的工作流,在这里让我们学习一些例子。 本书后续章节会研究风险建模、欺诈检测、客户视图、流失预测和产品推荐。对于诸如此类的项目,目标往往是确定某些问题的原因,或者建立一个因果模型。下面是使用工作流建立一个因果模型的一个例子。 1.检查数据结构,以确保更好地理解数据: 数据是横截面数据吗?是隐含着时间信息的合并数据吗? 是否使用了分类变量? 2.....

文章 2017-05-02 来自:开发者社区

Apache Spark机器学习.1.6 机器学习工作流和Spark pipeline

1.6 机器学习工作流和Spark pipeline 在本节中,我们介绍机器学习工作流和Spark pipeline,然后讨论Spark pipeline作为机器学习计算工作流的优秀工具是如何发挥作用的。 学习完本节,读者将掌握这两个重要概念,并且为编程和实现机器学习工作流的Spark pipeline做好准备。 机器学习的工作流步骤 几乎所有的机器学习项目均涉及数据清洗、特征挖掘、模型估计、.....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注
相关镜像