功能简介

数据资产管理体系主要包括以下几个方面的内容。数据资产编目,数据管理者对平台数据资产进行梳理,确定其共享属性,并按照技术标准,进行数据类目定义。数据资产上线,将已经注册管理的高质量数据资产资源发布,供数据使用者查询和使用。...

运营

数据资产管理体系主要包括以下几个方面的内容。数据资产编目,数据管理者对平台数据资产进行梳理,确定其共享属性,并按照技术标准,进行数据类目定义。数据资产上线,将已经注册管理的高质量数据资产资源发布,供数据使用者查询和使用。...

功能简介

数据资产管理体系主要包括以下几个方面的内容。数据资产编目,数据管理者对平台数据资产进行梳理,确定其共享属性,并按照技术标准,进行数据类目定义。数据资产上线,将已经注册管理的高质量数据资产资源发布,供数据使用者查询和使用。...

公开数据集概述

国家统计数据集 national_data TPC性能数据 TPC-DS TPC-DS是一个面向决策支持的基准,它对决策支持系统的几个普遍适用的方面进行建模,包括查询和数据维护等,使大数据系统等新兴技术能够执行基准测试。TPC-DS 10GB性能测试集 TPC-DS 100GB...

ActionTrail日志清洗

DLA提供ActionTrail日志自动清洗解决方案,可以将ActionTrail投递到OSS的日志文件转换为DLA中可以直接查询的数据表,同时自动对数据进行分区和压缩,方便您分析和审计对云产品的操作日志。日志分析痛点 ActionTrail是阿里云提供的云账号...

概述

事实上,鉴于数据库研究在数据发现、数据管理、版本控制、数据清理和数据集成方面积累的专业知识,PolarDB for AI 可以为数据驱动的智能应用提供一站式的数据包括:数据、特征和模型)服务来解决这种割裂状态,大大减少数据驱动的智能...

Logview诊断实践

写表的数据分布情况主要取决于写表的阶段(对应上图的R12)是如何Shuffle和排序的,上图给出的SQL最后的操作是Join,Join Key为如下代码:on t1.query=t2.query and t1.item_id=t2.item_id 研究一下数据的特征部分列都是item的属性,也...

高压缩引擎(X-Engine)介绍

它可以同时作为多个业务历史数据的汇聚地,以方便对所有历史数据进行集中存储和管理,主要适用于如下几个场景:将 PolarDB 高压缩引擎(X-Engine)作为线下自建数据库实例的冷数据存储地,线下自建数据包括但不限于MySQL、TiDB、...

SQL优化技术

在传统的优化处理中,这一过程一般完全依赖人力驱动,常常会暴露出两个方面的严重不足:T1过于偏后,即异常发现不及时、响应不及时,即使发现时,问题可能已堆积多时,已处在故障的边缘。T2-T1所代表的处理时间过长,一方面严重影响用户...

Cost-based SQL诊断引擎

在阿里巴巴集团内部,我们已经对数据库实例上全部SQL进行实时采集和存储,借助阿里巴巴这个大平台业务的丰富性和SQL场景的丰富性,以特征化形式描述为抓手对线上海量全量SQL资源分析搜寻符合指定特征的真实案例,抽取测试案例所需的信息,...

列存索引技术架构介绍

同时,结合 PolarDB 基于共享存储一写多读的架构特征,其包含如下几个关键的技术创新点:存储引擎(InnoDB)支持存储列式索引(Columnar Index),用户可以通过DDL语句为一张表中的全部列或者部分列创建列索引,列索引采用列压缩存储,其...

8.0.1和8.0.2版功能对比

PolarDB for MySQL 8.0.1版和8.0.2版在功能上存在一些差异,包括Warm Buffer Pool、Hash Join、弹性并行查询、执行器增强、优化器增强、分区表、多主集群(库表)、Blink Tree等方面的差异。本文介绍这两版本的功能区别,以便您基于业务...

PolarDB HTAP实时数据分析技术解密

在处理大数据量下复杂查询所需要的能力方面,如优化器处理子查询的能力、高性能算子HashJoin、SQL并行执行等。社区将其处于低优先级,因此MySQL的数据分析能力提升进展缓慢。随着MySQL的发展,用户使用其存储了大量的数据,并且运行着关键...

准备数据源和计算源

准备数据源 Dataphin支持对接的数据包括大数据存储型数据源、文件数据源、消息队列数据源、关系型数据源和NoSQL数据源,各模块支持对接的数据源类型及操作指导,请参见 Dataphin支持的数据源。重要 确定业务数据源类型后,在Dataphin创建...

准备数据源和计算源

准备数据源 Dataphin支持对接的数据包括大数据存储型数据源、文件数据源、消息队列数据源、关系型数据源和NoSQL数据源,各模块支持对接的数据源类型及操作指导,请参见 Dataphin支持的数据源。重要 确定业务数据源类型后,在Dataphin创建...

Dataphin支持的数据

背景信息 Dataphin支持对接的数据包括大数据存储型数据源、文件数据源、消息队列数据源、关系型数据源和NoSQL数据源,各模块支持对接的数据源类型说明如下:如果您需要在Dataphin中连接某数据源,则需要先在数据源管理中创建该数据源。...

数据源管理概述

功能介绍 多数据源类型接入:Dataphin内置丰富的数据源类型,支持对接的数据包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系型数据源和NoSQL数据源。更多信息,请参见 Dataphin支持的数据源。自定义数据源类型:在内置的...

数据源管理概述

功能介绍 多数据源类型接入:Dataphin内置丰富的数据源类型,支持对接的数据包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系型数据源和NoSQL数据源。更多信息,请参见 Dataphin支持的数据源。自定义数据源类型:在内置的...

Dataphin支持的数据

背景信息 Dataphin支持对接的数据包括大数据存储型数据源、文件数据源、消息队列数据源、关系型数据源和NoSQL数据源,各模块支持对接的数据源类型说明如下:如果您需要在Dataphin中连接某数据源,则需要先在数据源管理中创建该数据源。...

技术发展趋势

近些年来,数据在国民经济各个领域扮演着愈发重要的作用,其使用特点较之以往也发生了诸多变化,其趋势主要有几个方面。规模爆炸性增长 随着8K、5G、IoT、大数据、AI等系列技术的发展,数据量迎来了爆发式增长。IDC在《Data Age 2025》的...

分布表

使用场景 是否使用分区表,可以通过以下几个方面进行考虑:表数据量是否足够:通常对于的事实表,比如数据量有几千万或者过亿,可以考虑使用分区表,但数据量大小并没有一个绝对的标准可以使用,一般是根据经验,以及对目前性能是否...

非结构化分析

的向量分析特性针对非结构化数据检索分析,与普通的检索系统有较的差异,主要体现在下面的点:结构化和非结构化混合分析 例如,可以检索与输入图片中的连衣裙相似度最高、价格在100元到200元之间且上架时间在最近1月以内的产品。...

DataWorks模块使用说明

使用流程与主要子模块 DataWorks为您提供从端到端的一站式数据开发治理平台,数据处理流程主要包括以下几个阶段。各个阶段DataWorks的主要子模块如下。数据集成 子模块:数据集成 功能说明:数据集成是稳定高效、弹性伸缩的数据同步平台,...

特征管理

特征工程可能包括选择最相关的特征、将原始数据转换为更适合机器学习算法的格式、创建从原始数据派生的新特征等。以下是一些常见的特征使用场景:分类问题:邮件分类:使用邮件内容的单词和短语作为特征来识别垃圾邮件。图片识别:使用像素...

ClickHouse概述

开源大数据平台E-MapReduce(简称EMR)的ClickHouse提供了开源OLAP分析引擎ClickHouse的云上托管服务。EMR ClickHouse完全兼容开源版本的产品特性,同时提供集群快速部署、集群管理、扩容、缩容和监控告警等云上产品功能,并且在开源的基础...

产品架构

有如下几个弊端:涉及的技术组件多且杂 技术选型复杂 数据存取、数据同步的链路长 这些弊端会对信息系统建设带来巨大的问题,对技术人员要求高、业务上线周期长、故障率高、维护成本高。更进一步,技术碎片化导致技术架构割裂,不利于技术...

客户案例

优化结果 OceanBase 在一致性方面做了以下几个事情,架构层面引入 Paxos 协议,多重数据校验机制,完善支付宝业务模型,多重机制保障金融级别的一致性。OceanBase 的高可用策略与传统的基于共享存储的方案有很不同,OceanBase 采用 Share...

应用场景

根据数据量和网络条件,迁移过程可能需要几个小时甚至几天的时间。这个漫长的过程可能会对您的业务产生很的影响。DTS则可以帮助您以最小化的停机时间迁移您的数据。在数据迁移期间,您的应用程序仍可以保持运行状态。唯一的停机时间是当...

基本概念

数据资产:数据资源平台中存在大量的数据表、标签、API等各类数据资产,数据管理者通过数据汇聚、数据治理、数据分析后,需要对整个平台数据进行统一管控,了解平台的核心数据资产,提供对应的数据资产管理规范。统一服务 应用:是调用API...

X-Engine简介

对性能影响比较的Compaction过程做了大量优化:拆分数据存储粒度,利用数据更新热点较为集中的特征,尽可能的在合并过程中复用数据。精细化控制LSM的形状,减少I/O和计算代价,有效缓解了合并过程中的空间增大。同时使用更细粒度的访问...

核心概念

数据的业务含义存在较差异时,您可以创建不同的数据板块,独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。在Dataphin中,项目可以归属至数据板块以实现规范建模功能,同一个数据板块中可能包含不同的项目,所以...

行业趋势与背景

行业趋势 数据库系统至关重要 数据库与操作系统、中间件并称为系统软件的三驾马车,是企业IT系统不可或缺的组件,也是互联网应用级企业信息管理系统存储数据和管理数据的核心平台。数据库系统是一切应用软件的数据处理及交换核心,是所有...

什么是MaxCompute

MaxCompute是适用于数据分析场景的企业级SaaS(Software as a Service)模式云数据仓库,以Serverless架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您可以经济并高效...

阶段一:基础防护建设

在该阶段,DataWorks为您提供了数据分类分级、规范数据开发流程、企业级身份认证、开源身份隔离等多场景的最佳实践,帮助企业做好数据安全治理的相关基础防护工作。场景一:数据分级分类 无论在任何行业,数据分级分类都是监管首要检查的...

基本概念

时空几何 DLA Ganos中所称的时空几何,其范畴包含以下几方面:时空几何对象。矢量数据,如点、线、面状要素。在矢量数据基础上结合时间属性,组成的时空数据(或时空轨迹数据)。针对时空几何对象的相关操作,如时空关系判断。时空索引 DLA...

表设计规范

23省,5自治区,4直辖市,2特别行政区,50地区(州、盟),661市(其中直辖市4、地级市283、县级市374),1636县(自治县、旗、自治旗、特区和林区),按照最细粒度县进行分区后,不应再按照更细粒度的小时进行分区。...

产品优势

本文从核心功能、性能、成本等方面,将 云原生多模数据库 Lindorm 与开源HBase、开源Cassandra、OpenTSDB、开源ElasticSearch、开源Solr和开源HDFS进行了对比,帮助您进一步了解Lindorm与其他数据库产品的区别以及Lindorm在各方面的优势。...

MongoDB 5.0新特性概览

将重新分片花费的时间从几周或几个月压缩到几分钟或几小时,避免了冗长繁杂的手动数据迁移。通过使用在线重新分片,可以方便地在开发或测试环境中评估不同分片键的效果,也可以在您需要时修改分片键。您可以在业务运行(数据不断增长)的...

如何基于LSM-tree架构实现一写多读

深入到存储引擎这一层来说,这几个产品都是基于B+tree的存储引擎,如果基于LSM-tree存储引擎来做呢?LSM-tree有它自己的特点,追加顺序写,数据分层存储,磁盘上数据块只读更有利于压缩。X-Engine引擎云上产品RDS(X-Engine)已经充分发挥...

权限管理与规范化数据开发

Step5:数据开发与生产 进行数据开发与生产前,您需要了解几个重要的概念。生产开发数据源 DataWorks支持基于标准模式工作空间对应的两个环境这一特性,来分别为这两个环境配置不同的数据库访问地址。即您可以在数据源配置界面分别为开发...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 云数据库 RDS 数据库备份 DBS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用