文章 2024-08-26 来自:开发者社区

【大数据管理新纪元】EMR Delta Lake 与 DLF 深度集成:解锁企业级数据湖的无限潜能!

随着大数据技术的发展,Apache Spark 成为了处理大规模数据集的首选工具。EMR (Elastic MapReduce) 是亚马逊提供的一项云服务,它简化了设置和运行 Spark 集群的过程。Delta Lake 和 DLF (Data Lake Framework) 是两个重要的开源项目,它们共同提升了数据湖的可靠性和性能。本文将通过具体的案例...

文章 2024-07-28 来自:开发者社区

阿里巴巴大数据实践之数据建模:构建企业级数据湖

引言随着互联网和移动互联网的快速发展,数据已成为推动业务增长的重要驱动力。阿里巴巴作为全球领先的电子商务公司之一,其大数据平台支撑着整个集团的数据处理需求。本文将重点介绍阿里巴巴在数据建模领域的实践,包括数据湖的概念、数据建模的原则和方法、以及在实际业务场景中的应用案例。 一、数据湖概念与重要性1.1 数据湖定义数据湖是一种存储企业所有原始数据的集中式存...

文章 2023-12-25 来自:开发者社区

大数据开发企业级案例__某通信企业数据处理需求(建议收藏)

引言大家好,我是ChinaManor,直译过来就是中国码农的意思,我希望自己能成为国家复兴道路的铺路人,大数据领域的耕耘者,平凡但不甘于平庸的人。下面为大家带来大数据开发企业案例__通信行业企业数据处理需求,建议实操~相关数据链接:https://pan.baidu.com/s/1UuGqjx_NQ50NT64gY62hKQ提取码:ywt0大数据开发企业案例__通信行业企业数据处理需求(MapR....

大数据开发企业级案例__某通信企业数据处理需求(建议收藏)
文章 2023-12-12 来自:开发者社区

大数据Spark企业级实战与Hadoop实战&PDF和PPT

今天给大家分享的是《大数据Spark企业级实战》与《Hadoop实战》《大数据处理系统·Hadoop源代码情景分析》《50个大厂大数据算法教程》等销量排行前10名的大数据技术书籍(文末领取PDF版)。这些书籍具有以下几个优点:易读、实践性强,对解决工作中遇到的业务问题具有一定启发性。本书完全从企业处理大数据业务场景的角度出发,完全基于实战代码来组织内容,从零起步,完全无痛地掌握Spark大数据处....

大数据Spark企业级实战与Hadoop实战&PDF和PPT
文章 2023-09-16 来自:开发者社区

大数据数据倾斜问题与企业级解决方案

1 数据倾斜问题在实际工作中,如果我们想提高MapReduce的执行效率,最直接的方法是什么呢?我们知道MapReduce是分为Map阶段和Reduce阶段,其实提高执行效率就是提高这两个阶段的执行效 率默认情况下Map阶段中Map任务的个数是和数据的InputSplit相关的,InputSplit的个数一般是和Block块 是有关联的,所以可以认为Map任务的个数和数据的block块个数有关系....

大数据数据倾斜问题与企业级解决方案
文章 2023-09-16 来自:开发者社区

大数据Hadoop小文件问题与企业级解决方案

1 MapReduce性能优化现在大家已经掌握了MapReduce程序的开发步骤,注意了,针对MapReduce的案例我们并没有讲太多,主要是因为在实际工作中真正需要我们去写MapReduce代码的场景已经是凤毛麟角了,因为后面我们会学习一个大数据框架Hive,Hive支持SQL,这个Hive底层会把SQL转化为MapReduce执行,不需要 我们写一行代码,所以说工作中的大部分需求我们都使用S....

文章 2023-08-16 来自:开发者社区

大数据Spark企业级实战与Hadoop实战&PDF和PPT

今天给大家分享的是《大数据Spark企业级实战》与《Hadoop实战》《大数据处理系统·Hadoop源代码情景分析》《50个大厂大数据算法教程》等销量排行前10名的大数据技术书籍(文末领取PDF版)。这些书籍具有以下几个优点:易读、实践性强,对解决工作中遇到的业务问题具有一定启发性。本书完全从企业处理大数据业务场景的角度出发,完全基于实战代码来组织内容,从零起步,完全无痛地掌握Spark大数据处....

大数据Spark企业级实战与Hadoop实战&PDF和PPT
文章 2023-05-25 来自:开发者社区

带你读《企业级云原生白皮书项目实战》——5.2.1 开始使用(1)

5.2 云原生大数据计算服务 MaxCompute云原生大数据计算服务 MaxCompute 是适用于数据分析场景的企业级SaaS(Software as a Service)模式云数据仓库,以Serverless架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使用户可以经济并高效地分析处理海量数据。MaxCompute (原名ODPS....

带你读《企业级云原生白皮书项目实战》——5.2.1 开始使用(1)
文章 2023-05-25 来自:开发者社区

带你读《企业级云原生白皮书项目实战》——5.2.1 开始使用(2)

《企业级云原生白皮书项目实战》——第五章 大数据——5.2 云原生大数据计算服务 MaxCompute——5.2.1 开始使用(1) https://developer.aliyun.com/article/1228621?groupCode=supportservice5.2.1.2 项目创建项目(Project)是MaxCompute的基本组织单元,是进行多用户隔离和访问控制的主要边界。开通....

带你读《企业级云原生白皮书项目实战》——5.2.1 开始使用(2)
文章 2023-05-25 来自:开发者社区

带你读《企业级云原生白皮书项目实战》——5.2.2 使用安全(1)

5.2.2 使用安全5.2.2.1 安全相关设置针对MaxCompute项目级别的安全设置,最为关键的是ProjectProtection策略。假设某用户同时有A、B两个项目的权限,通过如下指令即可实现全表数据的项目间转移,风险是极高的。create table project2.table2 as select * from project1.table1;默认情况下ProjectProtec....

带你读《企业级云原生白皮书项目实战》——5.2.2 使用安全(1)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

大数据计算 MaxCompute

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

+关注