文章 2023-12-20 来自:开发者社区

【大数据技术Hadoop+Spark】Flume、Kafka的简介及安装(图文解释 超详细)

Flume简介Flume是Cloudera提供的一个高可用、高可靠、分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。Flume主要由3个重要的组件构成:1)Source:完成对日志数据的收集,分成transtion 和 event 打入到channel之中。2)Cha....

【大数据技术Hadoop+Spark】Flume、Kafka的简介及安装(图文解释 超详细)
文章 2023-12-19 来自:开发者社区

【云计算与大数据技术】虚拟化简介及虚拟化的分类讲解(图文解释 超详细)

一、虚拟化简介1:什么是虚拟化虚拟化是指计算机元件在虚拟的基础上而不是在真实的、独立的物理硬件基础上运行。这种以优化资源、简化软件的重新配置过程为目的的解决方案就是虚拟化技术虚拟化架构就是在一个物理硬件机器上同时运行多个不同应用的独立的虚拟系统,这些同时运行的虚拟系统由Hyperviser来控制,虚拟机被称为guest,Hypervisor不仅可以提供虚拟系统资源,进行主机/虚拟机之间的调度,而....

【云计算与大数据技术】虚拟化简介及虚拟化的分类讲解(图文解释 超详细)

基于阿里云MaxCompute搭建数据仓库(离线)

70 课时 |
960 人已学 |
免费

阿里云大数据工程师ACA认证(2023版)

21 课时 |
3713 人已学 |
免费

基于MaxCompute的热门话题分析

8 课时 |
627 人已学 |
免费
开发者课程背景图
文章 2023-10-11 来自:开发者社区

Redis学习---大数据技术之Redis(NoSQL简介、Redis简介、Redis安装、五大数据类型、相关配置、持久化)

                                                        &nbs...

Redis学习---大数据技术之Redis(NoSQL简介、Redis简介、Redis安装、五大数据类型、相关配置、持久化)
文章 2022-02-16 来自:开发者社区

大数据数据库技术简介与分类分析

说起大数据生态,不得不提大数据生态系统图,而大数据行业却不断的发生着巨变,目前的这张图应该还算比较新了。 创业者们蜂拥至这个行业,这个行业正变得越来越拥挤。Hadoop似乎已经奠定了其作为整个大数据生态系统的关键部分,Spark是另一个基于内存计算的开源分布式计算框架,它试图填补Hadoop的弱项,提供更快的数据分析和良好的编程接口。 分析工具领域变得异常活跃,数据应用领域正如预测一样逐渐成为.....

文章 2022-02-16 来自:开发者社区

《深入理解大数据:大数据处理与编程实践》一一1.3 MapReduce并行计算技术简介

本节书摘来自华章计算机《深入理解大数据:大数据处理与编程实践》一书中的第1章,第1.3节,作者 主 编:黄宜华(南京大学)副主编:苗凯翔(英特尔公司),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.3 MapReduce并行计算技术简介 1.3.1 MapReduce的基本概念和由来1.?什么是MapReduceMapReduce是面向大数据并行处理的计算模型、框架和平台,它隐含了....

文章 2022-02-16 来自:开发者社区

《深入理解大数据:大数据处理与编程实践》一一1.2 大数据处理技术简介

本节书摘来自华章计算机《深入理解大数据:大数据处理与编程实践》一书中的第1章,第1.2节,作者 主 编:黄宜华(南京大学)副主编:苗凯翔(英特尔公司),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.2 大数据处理技术简介 1.2.1 大数据的发展背景和研究意义近几年来,随着计算机和信息技术的迅猛发展和普及应用,行业应用系统的规模迅速扩大,行业应用所产生的数据呈爆炸性增长。动辄达到数....

文章 2022-02-16 来自:开发者社区

《深入理解大数据:大数据处理与编程实践》一一1.1 并行计算技术简介

本节书摘来自华章计算机《深入理解大数据:大数据处理与编程实践》一书中的第1章,第1.1节,作者 主 编:黄宜华(南京大学)副主编:苗凯翔(英特尔公司),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.1 并行计算技术简介 1.1.1 并行计算的基本概念随着信息技术的快速发展,人们对计算系统的计算能力和数据处理能力的要求日益提高。随着计算问题规模和数据量的不断增大,人们发现,以传统的串....

文章 2022-02-16 来自:开发者社区

《深入理解大数据:大数据处理与编程实践》一一第1章 大数据处理技术简介

第1章 大数据处理技术简介 近年来,大数据技术在全世界迅猛发展,引起了全世界的广泛关注,掀起了一个全球性的发展浪潮。大数据技术发展的主要推动力来自并行计算硬件和软件技术的发展,以及近年来行业大数据处理需求的迅猛增长。其中,大数据处理技术最直接的推动因素,当数Google公司发明的MapReduce大规模数据分布存储和并行计算技术,以及Apache社区推出的开源Hadoop MapReduce并.....

文章 2022-02-16 来自:开发者社区

《R与Hadoop大数据分析实战》一2.2 Hadoop MapReduce技术简介

本节书摘来自华章出版社《R与Hadoop大数据分析实战》一书中的第2章,第2.2节,作者 (印)Vignesh Prajapati,更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.2 Hadoop MapReduce技术简介 一般而言,MapReduce模型可以使用多种语言实现,除此之外,Hadoop MapReduce也是一个用于方便编写应用程序的流行Java语言框架。通过把大数据在....

文章 2022-02-15 来自:开发者社区

【大数据技术干货】阿里云伏羲(fuxi)调度器FuxiMaster功能简介(一) 多租户(QuotaGroup)管理

免费开通大数据服务:https://www.aliyun.com/product/odps 转载自xingbao     各位好,这是介绍阿里云伏羲(fuxi)调度器系列文章的第一篇,今天主要介绍多租户(QuotaGroup)管理的实现一、FuxiMaster简介 FuxiMaster和Yarn非常相似,定位于分布式系统中资源管理与分配的角色:一个典型的资源分配流程图如下所示:...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute技术相关内容

云原生大数据计算服务 MaxCompute更多技术相关

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注