阿里云文档 2025-12-08

阿里云StarRocks业务使用最佳实践-开源大数据平台 E-MapReduce-阿里云

本文旨在为您介绍StarRocks的基础使用方法和常见操作,适用于首次接触StarRocks的用户。

阿里云文档 2025-09-19

阿里云EMR Serverless Spark Notebook集成DuckDB,支持免密访问OSS/OSS-HDFS并高效操作多种数据格式。

阿里云 EMR Serverless Spark 的 Notebook 会话中引入了 DuckDB 的 Python 库,除了支持 DuckDB 开源版本所具备的所有功能外,还额外提供了免密访问 OSS/OSS-HDFS 的能力,从而能够直接读取 OSS 路径下的文件进行操作。

阿里云文档 2025-07-08

阿里云EMR on ECS部分版本(EMR-1.xx-EMR-5.4.x)即将终止服务与支持

考虑到开源社区技术更迭和EMR产品功能升级,E-MapReduce制定了生命周期策略。根据生命周期策略,阿里云 EMR on ECS 部分版本计划于2025年10月20日EOS(服务与支持终止),建议您尽快升级使用EOS版本的EMR集群实例。

阿里云文档 2025-06-09

使用PyJindo访问阿里云OSS-HDFS

本文将以两种方式为您介绍如何在Python 3.6及更高版本中,利用Python的工具包PyJindo来操作OSS-HDFS。

文章 2024-08-26 来自:开发者社区

大数据革新在即,阿里云EMR如何布局DeltaLake引领行业潮流?

大数据时代,数据的实时处理和分析成为企业竞争的关键。Delta Lake 作为一款开源的存储层,以其高性能、高可靠性和支持 ACID 事务的特点,受到了业界的广泛关注。阿里云 EMR(Elastic MapReduce)作为国内领先的云计算服务提供商,对于 Delta Lake 的集成与应用自然有着深度的规划和布...

问答 2024-08-20 来自:开发者社区

阿里云 EMR 对于 DeltaLake 的读写性能有哪些优化计划?

阿里云 EMR 对于 DeltaLake 的读写性能有哪些优化计划?

问答 2024-08-20 来自:开发者社区

阿里云EMR如何基于DeltaLake实现CDC能力?

阿里云EMR如何基于DeltaLake实现CDC能力?

阿里云文档 2024-04-25

阿里云账号角色授权

使用EMR Serverless Spark前,需要授予您的阿里云账号AliyunServiceRoleForEMRServerlessSpark和AliyunEMRSparkJobRunDefaultRole系统默认角色。本文为您介绍角色授权的基本操作。

文章 2022-02-17 来自:开发者社区

阿里云 EMR Delta Lake 在流利说数据接入中的架构和实践

作者简介:张宽天,毕业于华中科技大学,先后在华为、阅文集团从事数据开发方面工作,2019年加入流利说,担任数据工程师,负责数据湖相关工作。 背景 流利说目前的离线计算任务中,大部分数据源都是来自于业务 DB,业务DB数据接入的准确性、稳定性和及时性,决定着下游整个离线计算 pipeline 的准确性和及时性。同时,我们还有部分业务需求,需要对 DB 中的数据和 hive 中的数据做近实时的联合查....

阿里云 EMR Delta Lake 在流利说数据接入中的架构和实践

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐