问答 2024-08-13 来自:开发者社区

随着分布式数据仓库集群规模增大,面临的一个主要挑战是什么?

随着分布式数据仓库集群规模增大,面临的一个主要挑战是什么?

问答 2024-08-13 来自:开发者社区

分布式数据仓库在实时分析(OLAP)中有哪些优势?

分布式数据仓库在实时分析(OLAP)中有哪些优势?

阿里云文档 2024-08-02

通过DataWorks将PolarDB分布式版的数据导入至AnalyticDBMySQL

DataWorks提供了可视化的数据导入方式,相对于通过外表导入,DataWorks导入的方式更为轻量化,适合数据量相对较小的数据导入场景。本文介绍如何通过DataWorks将PolarDB分布式版(原DRDS)的数据导入至AnalyticDB MySQL版湖仓版(3.0)或数仓版(3.0)。

问答 2023-07-13 来自:开发者社区

问一下,云数据仓库ADB,不做分布式,支持1.5亿的数据检索吗?几乎没有什么业务,只是Excel导入

问一下,云数据仓库ADB,不做分布式,支持1.5亿的数据检索吗?几乎没有什么业务,只是Excel导入导出,然后几个关键字段加下索引做查询,总共字段大概35个不到

文章 2023-05-18 来自:开发者社区

「大数据系列」:Apache Hive 分布式数据仓库项目介绍

Apache Hive™数据仓库软件有助于读取,编写和管理驻留在分布式存储中的大型数据集并使用SQL语法进行查询Hive 特性Hive构建于Apache Hadoop™之上,提供以下功能:通过SQL轻松访问数据的工具,从而实现数据仓库任务,如提取/转换/加载(ETL),报告和数据分析。...

「大数据系列」:Apache Hive 分布式数据仓库项目介绍
文章 2022-02-17 来自:开发者社区

DTCC 2020 | 阿里云李飞飞:云原生分布式数据库与数据仓库系统点亮数据上云之路

云计算时代,云原生分布式数据库和数据仓库开始崛起,提供弹性扩展、高可用、分布式等特性。 数据库将面临怎样的变革?云原生数据库与数据仓库有哪些独特优势?在日前的 DTCC 2020大会上,阿里巴巴集团副总裁、阿里云数据库产品事业部总裁、ACM杰出科学家李飞飞就《云原生分布式数据库与数据仓库系统点亮数据上云之路》进行了精彩分享。 阿里巴巴集团副总裁、阿里云数据库产品事业部总裁、ACM杰出科学家李飞.....

DTCC 2020 | 阿里云李飞飞:云原生分布式数据库与数据仓库系统点亮数据上云之路
文章 2022-02-16 来自:开发者社区

数据产品设计专题(5)- 分布式数据仓库技术架构

一、分布式数据仓库技术架构   二、核心内容解读  (1)分布式数据仓库存储技术:hive+hdfs;  (2)事实计算平台技术框架:spark;  (3)数据挖掘算法技术框架:mllib + sparkR   作者:张子良 出处:http://www.cnblogs.com/hadoopdev 本文版权归作者所...

文章 2021-11-15 来自:开发者社区

Apache Tajo:一个运行在YARN上支持SQL的分布式数据仓库

1. 背景当前,Hadoop之上的SQL引擎已经非常多了,概括起来有两类系统,分别是:(1)将SQL转化为MapReduce。典型代表是Apache Hive,这种系统的特点是扩展性和容错性好,但性能低下。为了弥补SQL on MapReduce的不足,google提出了...

Apache Tajo:一个运行在YARN上支持SQL的分布式数据仓库
文章 2020-06-09 来自:开发者社区

阿里云线上峰会已经开启!融合分布式、弹性计算与云计算的数据仓库长什么样?

阿里云峰会地址头号云话题地址 2020年6月9日,“全速重构”2020阿里云·线上峰会即将隆重召开。在此次峰会上,阿里云数据库重磅发布云原生分布式数据库 PolarDB-X 、云原生数据仓库AnalyticDB、数据库自治服务DAS、云数据库专属集群、图数据库GDB、云数据库Cassandra版、云数据库ClickHouse 7款跨时代产品,用技术倾情打造新数字时代的基石!今天小编为大家倾情呈现....

阿里云线上峰会已经开启!融合分布式、弹性计算与云计算的数据仓库长什么样?
文章 2017-11-12 来自:开发者社区

greenplum分布式集群(数据仓库)实战

1.准备环境 1.1集群介绍 系统环境:centos6.5 数据库版本:greenplum-db-4.3.3.1-build-1-RHEL5-x86_64.zip greenplum集群中,4台机器IP分别是 [root@dw-greenplum-1 ~]# cat /etc/hosts 127.0.0.1   localhost localhost.localdomain l...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云分布式应用服务

企业级分布式应用服务 EDAS(Enterprise Distributed Application Service)是应用全生命周期管理和监控的一站式PaaS平台,支持部署于 Kubernetes/ECS,无侵入支持Java/Go/Python/PHP/.NetCore 等多语言应用的发布运行和服务治理 ,Java支持Spring Cloud、Apache Dubbo近五年所有版本,多语言应用一键开启Service Mesh。

+关注