阿里云文档 2024-12-11

CU优惠活动

EMR Serverless Spark已于2014年11月18日推出CU折算优惠活动。

阿里云文档 2024-12-09

配置Ranger鉴权

Apache Ranger提供了集中式的权限管理框架。通过与Spark结合使用的Ranger Plugin,可以对Spark SQL访问数据库、表和列等进行细粒度的权限控制,从而增强数据访问的安全性。Spark Thrift Server会话支持配置Ranger Plugin来启用数据访问的权限控制。

阿里云文档 2024-12-09

支持的预设的系统权限策略列表

本文描述开源大数据平台 E-MapReduce支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。

阿里云文档 2024-11-27

2024-11-25版本说明

本文为您介绍2024年11月25日发布的EMR Serverless Spark的功能变更。

阿里云文档 2024-11-22

开启LDAP认证

通过启用LDAP认证,可以增强Spark Thrift Server的安全性,确保只有提供正确的用户名和密码后,客户端才能成功连接到Thrift Server并执行SQL查询,有效防止未授权访问敏感数据和功能的风险。

文章 2023-10-12 来自:开发者社区

【大数据处理框架】Spark大数据处理框架,包括其底层原理、架构、编程模型、生态圈

Spark大数据处理框架是一个开源的大数据处理框架,它可提供高效的内存计算,可在弹性、分布式的集群上运行。Spark框架的优势在于它能够更加高效地利用计算资源,提高数据处理速度,因此在大数据处理领域中广受欢迎。Spark框架的底层原理Spark框架的底层原理基于RDD(Resilient Distributed Datasets)模型,它是Spark的核心概念之一。RDD是一种抽象的数据结构,可....

文章 2022-04-21 来自:开发者社区

图解大数据 | 大数据分析挖掘框架@Spark初步

作者:韩信子@ShowMeAI教程地址:http://www.showmeai.tech/tutorials/84本文地址:http://www.showmeai.tech/article-detail/173声明:版权所有,转载请联系平台与作者并注明出处收藏ShowMeAI查看更多精彩内容1.Spark是什么学习或做大数据开发的同学,都听说或者使用过Spark,从这部分开始,ShowMeAI带....

图解大数据 | 大数据分析挖掘框架@Spark初步
文章 2022-02-16 来自:开发者社区

流式大数据处理的三种框架:Storm,Spark和Samza

流式大数据处理的三种框架:Storm,Spark和Samza

文章 2022-02-16 来自:开发者社区

三个大数据处理框架:Storm,Spark和Samza 介绍比较

转自:http://www.open-open.com/lib/view/open1426065900123.html 许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。 Apache Storm 在Storm中, 先要设计一个用于实时计算的图状结构,我们称之为拓扑(topology)。这个拓扑将会被提...

三个大数据处理框架:Storm,Spark和Samza 介绍比较
文章 2022-02-16 来自:开发者社区

大数据分析处理框架——离线分析(hive,pig,spark)、近似实时分析(Impala)和实时分析(storm、spark streaming)

大数据分析处理架构图 数据源: 除该种方法之外,还可以分为离线数据、近似实时数据和实时数据。按照图中的分类其实就是说明了数据存储的结构,而特别要说的是流数据,它的核心就是数据的连续性和快速分析性; 计算层: 内存计算中的Spark是UC Berkeley的最新作品,思路是利用集群中的所有内存将要处理的数据加载其中,省掉很多I/O开销和硬盘拖累,从而加快计算。而Impala思想来...

大数据分析处理框架——离线分析(hive,pig,spark)、近似实时分析(Impala)和实时分析(storm、spark streaming)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxComputespark相关内容

云原生大数据计算服务 MaxCompute更多spark相关

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

大数据计算 MaxCompute

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

+关注