带你读《企业级云原生白皮书项目实战》——5.2.4 SQL开发参考
5.2.4 SQL开发参考MaxCompute1SQL适用于海量数据(GB、TB、EB级别)离线批量计算的场景。提交MaxCompute作业后,会存在几十秒到数分钟不等的排队调度,所以适合处理批作业,提交一次作业批量处理海量数据。不适合直接对接需要每秒处理几千至数万笔事务的前台业务系统。5.2.4.1 语法部分语法上,如上图,它的语法是标准语法ANSI SQL92的一个子集,并有自己的扩展。如果....
带你读《企业级云原生白皮书项目实战》——5.2.5 多引擎开发参考
5.2.5多引擎开发参考5.2.5.1PyODPS为了帮助记忆,可以使用PyODPS = SDK + DataFrame API 公式来理解PyODPS的主要功能。•SDK它是MaxCompute的Python版本的SDK,提供对MaxCompute对象的基本操作,通过Python语言实现简单方便地操作MaxCompute对象(项目、表、分区、实例等)。•DataFramePyODPS支持类似P....
带你读《企业级云原生白皮书项目实战》——5.2.6 数据开发及任务调度(上)
5.2.6 数据开发及任务调度5.2.6.1 set命令设置环境变量MaxCompute同时支持project级别和session级别来设置系统环境变量:set =; 或 setproject =;环境变量将影响到SQL行为、认证鉴权等安全行为、数据类型、runtime属性等开发环境中您将遇到的方方面面,是整个serverless数仓提供给用户的最主要的配置接口。下面摘取一些较为常见的flfla....
带你读《企业级云原生白皮书项目实战》——5.2.6 数据开发及任务调度(下)
《企业级云原生白皮书项目实战》——第五章 大数据——5.2 云原生大数据计算服务 MaxCompute——5.2.6 数据开发及任务调度(上) https://developer.aliyun.com/article/1228467?groupCode=supportservice5.2.6.2使用DataWorks进行作业调度DataWorks提供了高度可视化的集成开发环境(IDE),给Max....
带你读《企业级云原生白皮书项目实战》——5.2.7 运维
5.2.7 运维5.2.7.1 元数据信息5.2.7.1.1 项目级别元数据各个集群的元数据信息实际上是存储在各个集群的information_schema这个project中。project的owner为产品的服务账号。如5.2.2.2.4中介绍,此种场景,产品设计上正是通过package的授权模式,将元数据信息开放给到各个租户使用。通过安装命令,获得当前项目的原数据信息:install pa....
带你读《企业级云原生白皮书项目实战》——5.2.8 小结
5.2.8 小结本章节简要介绍了MaxCompute云原生大数据计算服务这一大数据产品,及其在使用的全生命周期各个阶段的一些最佳实践分享,贯穿从选型开通到开发运维的各个阶段。在官网产品文档的基础上,对于重点概念和特性做了进一步探讨,加入了个人及团队在大量troubleshooting及运维真实案例中沉淀的宝贵知识。更多内容,欢迎参阅:MaxCompute产品文档
带你读《企业级云原生白皮书项目实战》——5.3.1 开始使用(1)
5.3 实时计算Flink版5.3.1 开始使用5.3.1.1 Flink基础架构Apache Flink是一个面向分布式数据流处理和批量数据处理的开源计算平台。它能够基于同一个Flink运行时(Flink Runtime),提供支持流处理和批处理两种类型应用的功能。现有的开源计算方案,会把流处理和批处理作为两种不同的应用类型,因为他们它们所提供的SLA是完全不相同的:•流处理一般需要支持低延迟....
带你读《企业级云原生白皮书项目实战》——5.3.1 开始使用(2)
《企业级云原生白皮书项目实战》——第五章 大数据——5.3 实时计算Flink版——5.3.1 开始使用(1) https://developer.aliyun.com/article/1228414?groupCode=supportservice5.3.1.2 实例创建Flink目前有公共云,金融云两种产品形态,可以通过Flink控制台来进行快速的实例创建,运行环境是在容器中,数据存储在实例....
带你读《企业级云原生白皮书项目实战》——5.3.1 开始使用(3)
《企业级云原生白皮书项目实战》——第五章 大数据——5.3 实时计算Flink版——5.3.1 开始使用(2) https://developer.aliyun.com/article/1228412?groupCode=supportservice5.3.1.3子账号授权Flink全托管为您提供了以下三种权限策略,您可以根据业务情况为RAM用户选择适合的权限策略。自定义授权可以指定具体实例授权....
带你读《企业级云原生白皮书项目实战》——5.3.2 Flink任务开发相关(1)
5.3.2 Flink任务开发相关5.3.2.1 Flink CDC开发说明CDC 的全称是 Change Data Capture ,在广义的概念上,只要是能捕获数据变更的技术,我们都可以称之为 CDC 。目前通常描述的 CDC 技术主要面向数据库的变更,是一种用于捕获数据库中数据变更的技术。CDC 技术的应用场景非常广泛:•数据同步:用于备份,容灾;•数据分发:一个数据源分发给多个下游系统;....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
云原生更多企业级相关
阿里云云原生
关注云原生中间件、微服务、Serverless、容器、Service Mesh等技术领域、聚焦云原生技术趋势、云原生大规模的落地实践
+关注