阿里云文档 2023-06-07

如何使用StarRocks的数据湖分析能力查询阿里云OSS

本文为您介绍如何使用StarRocks的数据湖分析能力查询阿里云OSS。

阿里云文档 2023-01-28

Dataflow集群如何连接DLF,并读取Hudi全量数据

EMR-3.38.3及后续版本的DataFlow集群,可以通过数据湖元数据DLF(Data Lake Formation)作为元数据读取DataLake集群或自定义集群中的数据。本文为您介绍Dataflow集群如何连接DLF,并读取Hudi全量数据。

大数据知识图谱系列—如何选择合适的OLAP引擎进行数据湖分析

4 课时 |
138 人已学 |
免费
开发者课程背景图
文章 2022-10-15 来自:开发者社区

数据湖大数据处理之Lambda架构学习笔记

开发者学堂课程【Cassandra数据库入门与实战:数据湖大数据处理之Lambda架构】学习笔记,与课程紧密联系,让用户快速学习知识。课程地址:https://developer.aliyun.com/learning/course/784数据湖大数据处理之Lambda架构 内容简介:一、大数据 数据湖和Lambda架构简介二、Apache cassandra, Spark和pulsar的lam....

数据湖大数据处理之Lambda架构学习笔记
文章 2022-02-17 来自:开发者社区

数据湖大数据处理之Lambda架构|学习笔记

开发者学堂课程【Cassandra数据库入门与实战:数据湖大数据处理之Lambda架构】学习笔记,与课程紧密联系,让用户快速学习知识。课程地址:https://developer.aliyun.com/learning/course/784数据湖大数据处理之Lambda架构 内容简介:一、大数据 数据湖和Lambda架构简介二、Apache...

数据湖大数据处理之Lambda架构|学习笔记
文章 2022-02-17 来自:开发者社区

数据湖大数据处理之Lambda架构

一、简介(一)DataStax公司DataStax 公司长久以来被人们认为是Apache Cassandra的商业公司,在C*项目的早期,DataStax公司贡献了85%以上的代码,DataStax也是近年代码的主要贡献者,占比在40-50%左右。最近几年,DataStax专注于把 Cassandr...

数据湖大数据处理之Lambda架构
文章 2022-02-17 来自:开发者社区

数据湖 VS 数据仓库之争?阿里提出大数据架构新概念:湖仓一体

作者 |关涛、李睿博、孙莉莉、张良模、贾扬清(from 阿里云智能计算平台) 黄波、金玉梅、于茜、刘子正(from 新浪微博机器学习研发部) 编者按 随着近几年数据湖概念的兴起,业界对于数据仓库和数据湖的对比甚至争论就一直不断。有人说数据湖是下一代大数据平台,各大云厂商也在纷纷的提出自己的数据湖解决方案,一些云数仓产品也增加了和数据湖联动的特性。但是数据仓库和数据湖的区别到底是什么,是技术路线之....

数据湖 VS 数据仓库之争?阿里提出大数据架构新概念:湖仓一体
文章 2022-02-17 来自:开发者社区

业内首次融合数据仓库与数据湖 阿里云推出下一代大数据平台 “湖仓一体”

9月18日,2020云栖大会上,阿里云正式推出大数据平台的下一代架构——“湖仓一体”,打通数据仓库和数据湖两套体系,让数据和计算在湖与仓之间自由流动,从而构建一个完整的有机的大数据技术生态体系。为企业提供兼具数据湖的灵活性和数据仓库的成长性的新一代大数据平台,降低企业构建大数据平台的整体成本。大数据技术从本世纪初发展至今演进出了数据仓库和数据湖两种趋势,前者通常指云厂商提供的基于大数据技术的一体....

业内首次融合数据仓库与数据湖  阿里云推出下一代大数据平台 “湖仓一体”
文章 2022-02-17 来自:开发者社区

云原生数据湖解决方案打破数据孤岛,大数据驱动互娱行业发展

行业综述 全民娱乐时代,网络互娱市场持续保持高速增长随着互联网的普及以及技术的发展,互联网娱乐行业的发展也日渐成熟。从早期单一门户网站,到个人博客的流行,再到视频网站的壮大。以及这两年层出不穷的短视频、直播、资讯平台等,网络娱乐行业的发展也正在从内容为王,开始往大数据驱动内容创新与推广的方向进行发展。随着生活条件的变好,人们进入了娱乐即生活,生活即娱乐的时代。如同互联网时代到来引爆信息爆炸一样,....

云原生数据湖解决方案打破数据孤岛,大数据驱动互娱行业发展
文章 2022-02-17 来自:开发者社区

JindoFS: 云上大数据的高性能数据湖存储方案

本场视频链接:云上大数据的一种高性能数据湖存储方案 ppt观看:https://www.slidestalk.com/AliSpark/0761944 EMR JindoFS背景 计算存储分离已经成为云计算的一种发展趋势。在计算存储分离之前,普遍采用的是传统的计算存储相互融合的架构(下图左侧),但是这种架构存在一定的问题,比如在集群扩容的时候会面临计算能力和存储能力相互不匹配的问题。用户在某些.....

JindoFS: 云上大数据的高性能数据湖存储方案
文章 2022-02-17 来自:开发者社区

JindoFS解析 - 云上大数据高性能数据湖存储方案

作者:殳鑫鑫,花名辰石,阿里巴巴计算平台事业部EMR团队技术专家,目前从事大数据存储以及Spark相关方面的工作。 2019 年云栖大会上,EMR Jindo 的技术存储分离方案得到很大的关注,视频直达链接【云上大数据的一种高性能数据湖存储方案】 【EMR打造高效云原生数据分析引擎】 JindoFS背景 计算存储分离是云计算的一种发展趋势,传统的计算存储相互融合的的架构存在一...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐