Iceberg

您可以借助Iceberg快速地在HDFS或者阿里云OSS上构建自己的数据湖存储服务,并借助开源大数据生态的Spark、Flink、Hive和Presto等计算引擎来实现数据湖的分析。核心能力 Apache Iceberg设计初衷是为了解决Hive数仓上云的问题,经过多年迭代...

Iceberg概述

您可以借助Iceberg快速地在HDFS或者阿里云OSS上构建自己的数据湖存储服务,并借助开源大数据生态的Spark、Flink、Hive和Presto等计算引擎来实现数据湖的分析。核心能力 Apache Iceberg设计初衷是为了解决Hive数仓上云的问题,经过多年迭代...

向量分析

AnalyticDB PostgreSQL版 向量分析可以通过AI算法提取非结构化数据的特征,并利用特征向量作为非结构化数据的唯一标识,帮您快速且低成本地实现对非结构化数据检索和对结构化数据关联分析。向量数据库简介 在现实世界中,绝多数的数据都...

测试案例

背景介绍 TPC-DS是一套决策支持系统的基准测试,它对决策支持系统的几个通用方面进行建模,包括查询和数据维护,用于衡量大数据产品的分析性能。TPC-DS模拟了零售企业三种销售渠道(实体店、互联网、目录)的销售和退货业务,除了建立相关...

升级数据库版本

本文介绍云数据库MongoDB支持升级的数据版本以及如何升级数据版本。注意事项 升级分片集群实例的数据版本时,实例的协议类型需为 MongoDB协议。升级采用轮转升级的方式进行,升级过程中会自动对实例进行2~3次重启,请在业务低...

基本概念

DTS 数据传输服务(Data Transmission Service,简称DTS)支持关系型数据库(RDBMS)、非关系型数据库(NoSQL)、数据多维分析(OLAP)等数据源间的数据交互,集数据同步、迁移、订阅、集成、加工于一体,帮助您构建安全、可扩展、高可用的...

功能特性

对于 Oracle 数据库,OceanBase 数据库能够支持绝部分的 Oracle 语法和几乎全量过程性语言功能,可以做到部分的 Oracle 业务进行少量修改后自动迁移。在多家金融行业客户和阿里巴巴内部已有多次迁移至 OceanBase 数据库的成功案例。...

Oracle数据

Oracle数据源为您提供读取和写入Oracle双向通道的功能,方便您后续可以通过向导模式和脚本模式配置数据同步任务。本文为您介绍DataWorks的Oracle数据同步能力支持情况。支持的版本 离线读写 版本 离线读(Oracle Reader)离线写(Oracle ...

配置TiDB输出组件

同步其他数据源的数据至TiDB数据源的场景中,完成源数据源的信息配置后,需要配置TiDB输出组件写入数据的目标数据源。本文为您介绍如何配置TiDB输出组件。前提条件 已创建TiDB数据源。具体操作,请参见 创建TiDB数据源。进行TiDB输出组件...

配置TiDB输出组件

同步其他数据源的数据至TiDB数据源的场景中,完成源数据源的信息配置后,需要配置TiDB输出组件写入数据的目标数据源。本文为您介绍如何配置TiDB输出组件。前提条件 已创建TiDB数据源。具体操作,请参见 创建TiDB数据源。进行TiDB输出组件...

产品概述

阿里云流数据处理平台数据总线DataHub是流式数据(Streaming Data)的处理平台,提供对流式数据的发布(Publish),订阅(Subscribe)和分发功能,让您可以轻松构建基于流式数据的分析和应用。数据总线 DataHub服务可以对各种移动设备,应用...

DB2数据

否 无 fetchSize 该配置项定义了插件和数据库服务器端每次批量数据获取条数,该值决定了数据同步系统和服务器端的网络交互次数,能够较大的提升数据抽取性能。说明 fetchSize 值过大(2048)可能造成数据同步进程OOM。否 1024 Writer脚本...

风险识别管理(新版)

规则名称 规则类型 规则等级 规则配置 非工作时间查询大数据量敏感数据 数据访问风险 低 如下时间段查询数据量大于10000时命中该规则。周一至周五:22:00~24:00。周六至周日:00:00~24:00。相似SQL查询 数据访问风险 低 十分钟内查询相似...

自建TiDB迁移至RDS MySQL

警告 为保障Kafka集群可以正常接收TiDB数据库产生的较大的Binlog数据,请适当将Broker组件中的 message.max.bytes、replica.fetch.max.bytes 参数以及Consumer组件中的 fetch.message.max.bytes 参数对应的值调大,详情请参见 Kafka配置...

权限自查建议

随着项目的不断演进,人员的权限也会更新迭代,您需要及时审视人员权限合理性,提升项目数据安全。本文为您介绍权限查询要点,并提供调整建议供参考。背景信息 在项目创建初期,为了提升业务处理效率,通常在用户和权限管理上相对宽松。...

目标库的注意事项及限制

MySQL系列数据库 MySQL 若您将列名仅小写不同的字段写入到目标MySQL数据库的同一个表中,可能会因为MySQL数据库列名小写不敏感,导致同步结果不符合预期。在数据同步完成后,建议使用 ANALYZE TABLE 表名 命令以确认数据均已写入目标表...

数据恢复

数据库MongoDB提供了多种数据恢复方案,可满足不同场景下MongoDB数据库的数据恢复需求。数据恢复至云数据库MongoDB实例 重要 将数据恢复至新实例时,请注意以下事项:新实例的数据版本需与原实例相同。您需要根据原实例的数据库版本...

新功能发布记录

迁移 PolarDB-O 数据库的数据至 OceanBase 数据库 Oracle 租户 新增支持 AnalyticDB MySQL 数据库至 OceanBase 数据库 MySQL 租户的数据迁移。您可以通过数据迁移的产品功能,将 ADB 的全量数据快速迁移至 OceanBase 数据库,满足用户实现...

离线同步能力说明

数据集成的离线同步功能为您提供数据读取(Reader)和写入插件(Writer),方便您通过定义来源与去向数据源,并结合DataWorks调度参数使用,将源端数据库中全量或增量数据的同步至目标数据库中。本文为您介绍离线同步的相关能力。使用限制 ...

数据导入

当您需要将大批量数据以附件(SQL、CSV、Excel)形式快速导入数据库时,可以使用DMS的数据导入功能。前提条件 数据库类型如下:MySQL:RDS MySQL、PolarDB MySQL版、MyBase MySQL、PolarDB分布式版、AnalyticDB for MySQL、其他来源MySQL。...

生成测试数据

背景信息 OceanBase 开发者中心(OceanBase Developer Center,ODC)提供模拟数据功能供用户在测试数据库性能或者验证功能等需要大量模拟数据的场景下,能够快速根据表中的字段类型生成数据。本文档旨在介绍如何在工单中,根据数据库中存在...

数据归档常见问题

归档为CSV格式的数据数据量可能会比归档为ORC格式的数据数据量更。为什么归档后的冷数据及文件在主账号下面的OSS上看不到?PolarDB 的冷数据存储在系统默认的OSS上,不在客户的OSS里,所以客户无法看到。目前只支持在PolarDB控制台上...

跨云或自建MongoDB逻辑备份与恢复

已选择的恢复时间点 选择需要恢复的时间,设置的时间必须在可恢复的时间范围内 恢复目标数据数据库所在位置 选择恢复目标数据库所在位置,支持类型如下:无公网IP:Port的自建数据库(通过数据库网关DG接入):可通过数据库网关备份自建...

区域热力层

数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

实时数仓概述

例如,与较大的离线维度表关联、表的多层嵌套、历史数据的回溯等。由于大部分业务实现需要多系统关联并搭建环境提取数据等,往往导致后期运维复杂。当出现问题时,不仅需要排查的组件多,而且需要对多种新知识进行学习和深度理解,才能找到...

API概览

3.在单表数据大的情况下创建索引,过程中会占用实例CPU、IO资源,如果影响实例可用性请调用CancelCreateIndexJob取消创建索引。DescribeCreateIndexJob 获取创建索引任务 获取创建索引任务 CancelCreateIndexJob 取消创建索引任务 取消...

点热力层(v3.x版本)

数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

点热力层(v3.x版本)

过滤器 打开 过滤器,选择已创建的数据过滤器或新建数据过滤器,并配置数据过滤器脚本,实现数据的筛选功能。详情请参见 管理数据过滤器。数据响应结果 实时展示了组件所使用的数据。当组件数据源发生变化时,数据响应结果会对应展示最新的...

某网约车公司车辆轨迹数据

解决方案 在原有的架构上引入了阿里云数据库,并将全量数据写到 云原生多模数据库 Lindorm 中,同时增量数据通过Kafka、Spark等实时同步到 云原生多模数据库 Lindorm,这样解决了客户线下数据数据大的问题。客户需要存储最近3年的数据...

区域热力层

图表样式 区域热力层是3D地球的子组件,支持独立的样式和数据配置,能够使用GeoJson数据展示区域边界信息并渲染区域样式,适用于在3D地球上展示某个区域的数据信息。样式面板 搜索配置:单击 样式 面板右上角的搜索配置项图标,可在搜索...

无感数据集成(Zero-ETL)

方案概述 在大数据时代,企业面临着大量分散在不同的系统和平台上的业务数据,为了有效地管理和利用这些数据,企业往往需要依赖于ETL工具对数据进行集中式管理。ETL是将上层业务系统的数据经过提取(Extract)、转换清洗(Transform)、...

功能特性

监控告警 数仓和数据湖 功能集 功能 功能描述 参考文档 数据存储 数据缓存 云数据库SelectDB支持数据缓存功能,当您需要管理缓存数据并提升云数据库 SelectDB 版的访问速度时,可以根据该文档对缓存进行有效管理,并利用LRU和TTL管理策略,...

DataStudio侧实时同步任务配置

完成数据源、网络、资源的准备配置后,您可创建实时同步任务,将多种输入及输出数据源搭配组成同步链路,进行单表或整库数据的实时增量同步。本文为您介绍如何创建单表或整库增量数据实时同步任务,并在创建完成后查看任务运行情况。前提...

确认表血缘

任务配置上下游节点依赖前,您需先确认当前节点的表血缘关系(例如,表数据间的血缘关系、表产出的分区数据),基于血缘关系配置节点的调度依赖。本文为您介绍如何确认表血缘,以及未基于表血缘配置节点依赖的影响。背景信息 确认表血缘,...

新功能发布记录

数据库RDS、云原生数据库PolarDB、云数据库MongoDB、云数据库 Tair(兼容 Redis)、云原生数据仓库AnalyticDB PostgreSQL版产品的备份恢复功能均由 数据灾备(DBS)提供,各产品功能动态详情如下。功能发布更新 2024年 11月 功能名称 ...

无感集成(Zero-ETL)

方案概述 在大数据时代,企业面临着大量分散在不同的系统和平台上的业务数据,为了有效地管理和利用这些数据,企业往往需要依赖于ETL工具对数据进行集中式管理。ETL是将上层业务系统的数据经过提取(Extract)、转换清洗(Transform)、...

逻辑结构说明

核心概念 简要含义 数据板块 数据板块定义了数据仓库的多种命名空间,是一种系统级的概念对象。当数据的业务含义存在较差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。主题...

MaxFrame

背景信息 在当今数据驱动时代大数据处理和人工智能(AI)技术的高效应用成为了企业和研究机构不可或缺的一部分。Python凭借其丰富的第三方开发生态(例如NumPy、Pandas和Scikit-learn)在数据科学领域内提供了强大的支持,但这些工具往往...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

数据仓库研发规范概述

大数据时代,规范地进行数据资产管理已成为推动互联网、数据、人工智能和实体经济深度融合的必要条件。贴近业务属性、兼顾研发各阶段要点的研发规范,可以切实提高研发效率,保障数据研发工作有条不紊地运作。而不完善的研发流程,会...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Tair(兼容 Redis®) 数据传输服务 人工智能平台 PAI 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用