文章 2021-07-14 来自:开发者社区

数据湖实操讲解【 AI 训练加速】第十七讲:Fluid + JindoFS 对 HDFS 上的数据进行训练加速

本期导读 :【AI 训练加速】第十七讲主题:FFluid + JindoFS 对 HDFS 上的数据进行训练加速luid+JindoFS 对 OSS 上数据进行训练加速讲师:辰山,阿里巴巴计算平台事业部 EMR 技术专家内容框架:什么是 Fluid + JindoFS (JindoRuntime)为什么使用 JindoRuntime 加速 HDFS 如何使用 JindoRuntime 演示直播回....

数据湖实操讲解【 AI 训练加速】第十七讲:Fluid + JindoFS 对 HDFS 上的数据进行训练加速
文章 2021-07-07 来自:开发者社区

数据湖实操讲解【AI 训练加速】第十六讲:Fluid + JindoFS 对 OSS 上数据进行训练加速

本期导读 :【AI 训练加速】第十六讲主题:FFluid + JindoFS 对 OSS 上数据进行训练加速luid+JindoFS 对 OSS 上数据进行训练加速讲师:扬礼,阿里巴巴计算平台事业部 开源大数据平台 开发工程师内容框架:Fluid 介绍Fluid JindoRuntime使用Fluid JindoRuntime 加速 OSS训练演示直播回放链接:(16讲)https://deve....

数据湖实操讲解【AI 训练加速】第十六讲:Fluid + JindoFS 对 OSS 上数据进行训练加速
文章 2021-07-02 来自:开发者社区

数据湖实操讲解【JindoFS 缓存加速】第十五讲:云上计算云下数据:HDFS 缓存加速

本期导读 :【JindoFS 缓存加速】第十五讲主题:云上计算云下数据:HDFS 缓存加速讲师:抚月,阿里巴巴计算平台事业部 开源大数据平台 技术专家内容框架:背景介绍功能介绍使用方法实操演示直播回放链接:(15讲)https://developer.aliyun.com/live/246996一、背景介绍问题和挑战:       传统的大数据服务,通常是自己部署一....

数据湖实操讲解【JindoFS 缓存加速】第十五讲:云上计算云下数据:HDFS 缓存加速
文章 2021-06-10 来自:开发者社区

数据湖实操讲解【OSS 访问加速】第十讲:Impala 如何高效查询 OSS 数据

本期导读 :【OSS 访问加速】第十讲主题:Impala 如何高效查询 OSS 数据讲师:流影,阿里巴巴计算平台事业部 EMR 技术专家内容框架:背景介绍Impala 使用 JindoSDK具体演示直播回放链接:(9/10讲)https://developer.aliyun.com/live/246875一、背景介绍Apache Impala 介绍能够对存储在 Hadoop 集群的 PB 级数据....

数据湖实操讲解【OSS 访问加速】第十讲:Impala 如何高效查询 OSS 数据
文章 2021-06-10 来自:开发者社区

数据湖实操讲解【OSS 访问加速】第九讲:Presto 如何高效查询 OSS 数据

本期导读 :【OSS 访问加速】第九讲主题:Presto 如何高效查询 OSS 数据讲师:健身,阿里巴巴计算平台事业部 EMR 技术专家内容框架:Presto 介绍JindoSDK 安装使用介绍相关资料直播回放链接:(9/10讲)https://developer.aliyun.com/live/246875一、Presto 介绍Presto 介绍:SQL-on-Anything为性能和规模而生....

数据湖实操讲解【OSS 访问加速】第九讲:Presto 如何高效查询 OSS 数据
文章 2021-05-19 来自:开发者社区

数据湖实操讲解【数据迁移】第四讲:如何将 Hive 数据按分区归档到 OSS

本期导读 :【数据迁移】第四讲主题:如何将 Hive 数据按分区归档到 OSS讲师:健身,阿里巴巴计算平台事业部 EMR 技术专家内容框架:背景/具体功能介绍实现原理详解使用实例直播回放链接:(3/4讲)https://developer.aliyun.com/live/246750一、背景/功能简述传统集群架构存储计算一体存储量与计算量无法始终匹配存储无法水平扩展存储与计算竞争硬盘资源存储分.....

数据湖实操讲解【数据迁移】第四讲:如何将 Hive 数据按分区归档到 OSS
文章 2021-05-13 来自:开发者社区

数据湖实操讲解【数据迁移】第二讲:数据无忧 - 利用 checksum 迁移 HDFS 数据到 OSS

本期导读 :【数据迁移】第二讲主题:数据无忧:利用 checksum 迁移 HDFS 数据到 OSS讲师:焱冰,阿里巴巴计算平台事业部 EMR 技术专家主要内容:Checksum 技术科普DistCp 技术解密Jindo DistCp 操作实战直播回放链接:(1/2讲)https://developer.aliyun.com/live/246728概念简述DistCp & Jindo .....

数据湖实操讲解【数据迁移】第二讲:数据无忧 - 利用 checksum 迁移 HDFS 数据到 OSS
文章 2021-02-24 来自:开发者社区

Flink 如何实时分析 Iceberg 数据湖的 CDC 数据

本文由李劲松、胡争分享,社区志愿者杨伟海、李培殿整理。主要介绍在数据湖的架构中,CDC 数据实时读写的方案和原理。文章主要分为 4 个部分内容:常见的 CDC 分析方案为何选择 Flink + Iceberg如何实时写入读取未来规划一、常见的 CDC 分析方案我们先看一下今天的 topic 需要设计的是什么?输入是一个 CDC 或者 upsert 的数据,输出是 Database 或者是用于大数....

Flink 如何实时分析 Iceberg 数据湖的 CDC 数据
问答 2021-01-07 来自:开发者社区

JindoTable数据湖之数据优化是什么?

JindoTable数据湖之数据优化是什么?

问答 2021-01-07 来自:开发者社区

基于 OSS 的数据湖存储是否满足高效数据计算的特性?

基于 OSS 的数据湖存储是否满足高效数据计算的特性?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐