文章 2024-07-04 来自:开发者社区

Spark大数据处理:技术、应用与性能优化(全)PDF书籍推荐分享

本书从一个系统化的视角,秉承大道至简的主导思想,介绍Spark中最值得关注的内容,讲解Spark部署、开发实战,并结合Spark的运行机制及拓展,帮读者开启Spark技术之旅。 Spark大数据处理:技术、应用与性能优化(全)PDF下载 Spark已经在全球范围内广泛使用,无论是Intel、Yahoo!、Twitter、阿里巴巴、百度、腾讯等国际互联网巨头,还是一些尚处于成长期的小公司,都在...

Spark大数据处理:技术、应用与性能优化(全)PDF书籍推荐分享
阿里云文档 2024-05-15

如何对数仓性能进行优化

针对数仓的性能优化,主要是针对表和数据分布的优化。

阿里云文档 2024-04-10

如何对数仓性能进行优化

针对数仓的性能优化,主要是针对表和数据分布的优化。

阿里云文档 2023-09-03

SmartData2.6.0-2.7.2版本的重大特性和性能优化_EMR on ECS_开源大数据平台 E-MapReduce(EMR)

SmartData的2.6.0-2.7.2版本,包含多个重大特性的发布以及大幅的性能优化。例如,Namespace服务后端存储支持Tablestore(OTS)以及Raft、Namespace服务支持HA、读写性能优化、块存储模式和缓存模式使用方式优化等。

阿里云文档 2023-08-15

如何提高访问OSS或OSS-HDFS数据时HTTP请求的响应速度

本文为您介绍如何提高访问OSS或OSS-HDFS数据时HTTP请求的响应速度,以便优化OSS或OSS-HDFS上的数据处理。

文章 2022-02-15 来自:开发者社区

大数据应用之HBase数据插入性能优化实测教程

引言:   大家在使用HBase的过程中,总是面临性能优化的问题,本文从HBase客户端参数设置的角度,研究HBase客户端数据批量插入性能优化的问题。事实胜于雄辩,数据比理论更有说服力,基于此,作者设计了这么一个HBase数据插入性能优化实测实验,希望大家用自己的服务器跑出的结果,给自己一个值得信服的结论。 一、客户单优化参数   1.Put List Size HBase的Put支持单条插入....

文章 2022-02-15 来自:开发者社区

大数据应用之HBase数据插入性能优化之多线程并行插入测试案例

一、引言:   上篇文章提起关于HBase插入性能优化设计到的五个参数,从参数配置的角度给大家提供了一个性能测试环境的实验代码。根据网友的反馈,基于单线程的模式实现的数据插入毕竟有限。通过个人实测,在我的虚拟机环境下,单线程插入数据的值约为4w/s。集群指标是:CPU双核1.83,虚拟机512M内存,集群部署单点模式。本文给出了基于多线程并发模式的,测试代码案例和实测结果,希望能给大家一些启示:....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

大数据计算 MaxCompute

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

+关注