变量管理
使用变量可以有效降低重复编写相同值的工作量,从而提升配置管理的效率。通过变量的复用,可以在SQL开发、批任务开发及工作流等场景中简化代码的维护和调整,进而提高开发效率。本文将为您详细介绍如何创建变量及其在不同场景下的具体使用方法。
读写HBase
基于HBase官方提供的Spark Connector,EMR Serverless Spark可以在开发时添加对应的配置来连接HBase。本文为您介绍在EMR Serverless Spark环境中实现HBase的数据读取和写入操作。
Spark Conf自定义参数列表
Serverless Spark支持多个内置特有参数,您可以查阅这些参数的名称、描述及其使用场景,以便灵活配置任务运行环境并优化任务执行。
通过DataWorks连接StarRocks实例
DataWorks的StarRocks数据源为您提供读取和写入StarRocks的双向通道,支持通过StarRocks节点进行任务开发和周期性调度,以及与其他作业的集成操作。本文为您介绍如何通过DataWorks连接StarRocks实例。
阿里云 EMR Serverless StarRocks3.x,极速统一的湖仓新范式
01 StarRocks背景介绍StarRocks定位 StarRocks 的定位两个比较关键的点,即极速和统一: “极速”是指其可以做到极致的性能,大大提升 OLAP 场景下查询的效率。从StarRocks 1.0版本开始打造的目标就是极致的速度,利用 CBO 及...

基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
背 景 随着互联网服务的广泛普及与技术应用的深入发展,日志数据作为记录系统活动、用户行为和业务操作的宝贵资源,其价值愈发凸显。然而,当前海量日志数据的产生速度已经远远超出了传统数据分析工具的处理能力,这不仅要求我们具备高效的数据收集和存储机制,更呼唤着强大、灵活且易用的数据分析平台的诞生。在此背景下,Apache Spark,这一专为...

美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台
作者:美的楼宇科技事业部 先行研究中心智能技术部 美的楼宇科技 IoT 数据平台建设背景 美的楼宇科技事业部(以下简称楼宇科技)是美的集团旗下五大板块之一,产品覆盖多联机组、大型冷水机组、单元机、机房空调、扶梯、直梯、货梯以及楼宇自控软件和建筑弱电集成解决方案,远销海内外200多个国家。针对当前设备数据量庞大且持续增长、数据呈现半结构化特点的现状,现有系统仅停留在数据存...

阿里云 EMR Serverless Spark 在微财机器学习场景下的应用
作者:微财技术研发经理 宋鑫 微财介绍 微财是一家创新型的金融科技企业,凭借多年积累的金融科技能力和数据处理优势,为客户提供消费分期等金融信息服务,致力于成为值得信赖的金融机构合作伙伴。旗下拥有好分期等品牌,为高成长用户提供信用分期借款过程中的综合性信息、技术以及辅助服务。 业务挑战 数据资源是金融科技企业的核心价值,微财依托大数据评估用户借款...

EMR Serverless StarRocks 全面升级:重新定义实时湖仓分析
一、EMR Serverless StarRocks发展路径 首先回顾Serverless Spark在EMR的发展路径。右边图是典型的大数据的架构图,存储层一般用HDFS或者是SI协议的OSS,处理层一般分为批处理和流处理。批处理一般实时标准是spark,流处理实时标准一般是Flink。分析层处于一种百家争鸣的状态。 在StarRocks出事之前,常见的几款的Olap...
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。