大数据互联网中台系统-大数据互联网中台系统文档介绍内容-阿里云

大数据安全治理的难点

通常，大数据系统中的工作流涉及多部门、多责任人且跨系统的数据，如何才能协调好这些业务系统准时、保质保量地产出数据，避免出现因业务系统宕机/脏数据导致数据延时产出、产出脏数据，关乎到企业数据业务的连续性问题甚至高层的信任问题...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线，您可以实时接入APP、WEB、IoT和数据库等产生的异构数据，统一管理，并投递到下游的分析、归档等系统，构建清晰的数据流，让您更好的释放数据的价值。...

概述

背景信息在大数据生态系统中，Alluxio位于数据驱动框架或应用（例如Apache Spark、Presto、TensorFlow、Apache Flink和Apache Hive等）和各种持久化存储系统（例如HDFS和阿里云OSS）之间，使得上层的计算应用可以通过统一的客户端API和...

数据服务

背景信息数据服务提供了数据中台建设过程中的数据服务化能力，面向数据开发者提供覆盖各个加工阶段统一体验的、便捷的数据查询转服务、服务管理、服务运维能力；面向数据资产管理者提供服务的统计分析、服务用量统计分析，实现数据中台...

功能简介

在数据中台建设过程中，搭建核心处理平台，并根据相关标准要求，将源数据或治理后的数据，按照“全面、高效、统筹”的共享原则，“低延时”、“精准化”地传递给用户，方便更多应用消费数据，实现数据价值。协同管控各种组织机构，为智慧化...

统一服务

在数据中台建设过程中，搭建核心处理平台，并根据相关标准要求，将源数据或治理后的数据，按照“全面、高效、统筹”的共享原则，“低延时”、“精准化”的传递给用户，方便更多应用消费数据，实现数据价值。协同管控各种组织机构，为智慧化...

功能简介

在数据中台建设过程中，搭建核心处理平台，并根据相关标准要求，将源数据或治理后的数据，按照“全面、高效、统筹”的共享原则，“低延时”、“精准化”地传递给用户，方便更多应用消费数据，实现数据价值。协同管控各种组织机构，为智慧化...

管理数据库资产

在进行数据库审计前，您必须在数据库审计系统中添加要审计的数据库。本文介绍了在数据库审计系统中添加、编辑、删除数据库的具体操作。背景信息关于数据库审计服务支持审计的数据库类型，请参见支持的数据库类型。重要数据库审计仅支持...

生态集成

云原生数据仓库AnalyticDB PostgreSQL版具备完善和开放的生态系统，支持无缝对接业界以及阿里云生态的数据管理工具，BI报表可视化工具，ETL工具，数据迁移工具，同时可以与业界流行的流式处理系统，日志类系统，大数据类系统，传统数仓及...

高压缩引擎（X-Engine）介绍

随着业务发展，数据库系统中会积累大量访问频率很低甚至为0的数据，这些数据的积累容易导致如下问题：历史数据和最新数据存储在同一数据库系统中，导致磁盘空间不足。大量数据共享数据库系统的内存、缓存空间、磁盘IOPS等，导致性能问题。...

清除数据

您可以在控制台清除云原生内存数据库Tair 实例中的所有过期数据或所有数据。操作步骤说明在参数设置中禁用 FLUSHALL 命令不会影响控制台中清除数据功能。访问 Tair实例列表，在上方选择地域，然后单击目标实例ID。在实例信息页面...

清除数据

您可以在控制台清除云数据库 Redis 版实例中的所有过期数据或所有数据。操作步骤说明在参数设置中禁用 FLUSHALL 命令不会影响控制台中清除数据功能。访问 Redis实例列表，在上方选择地域，然后单击目标实例ID。在实例信息页面，...

系统管理

本文介绍了在数据分析中设置系统管理的具体操作。您可以在系统管理中管理SQL查询任务时所使用的资源组。使用限制仅阿里云主账号可以访问系统管理页面。系统管理中的配置仅在本租户的当前地域生效。进入系统管理进入数据分析。在左侧菜单...

JindoData概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件，面向大数据和AI生态，为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现，主要包括JindoFS存储系统（原JindoFS Block模式）、...

审计经典网络数据库实例

如果需要审计经典网络数据库实例，您需要先通过ClassicLink功能实现经典网络的ECS与VPC中的数据库审计系统互通，并在经典网络的ECS上部署Agent程序。前提条件 VPC中启用ClassicLink时，需要满足限定条件，具体请参见ClassicLink概述的使用...

将云消息队列 Kafka 版的数据迁移至MaxCompute

本文介绍如何使用DataWorks数据同步功能，将云消息队列 Kafka 版集群上的数据迁移至阿里云大数据计算服务MaxCompute，方便您对离线数据进行分析加工。前提条件在开始本教程前，确保您在同一地域中已完成以下操作：云消息队列 Kafka 版 ...

Catalog概述

当FE将生成的查询计划分发给各个BE后，各个BE会并行扫描Hive存储系统中的目标数据，并执行计算返回查询结果。查询数据查询内部数据如果需要查询存储在StarRocks中的数据，请参见 Default Catalog。查询外部数据如果需要查询存储在外部...

Catalog概述

当FE将生成的查询计划分发给各个BE后，各个BE会并行扫描Hive存储系统中的目标数据，并执行计算返回查询结果。查询数据查询内部数据如果需要查询存储在StarRocks中的数据，请参见内表数据源。查询外部数据如果需要查询存储在外部数据源...

客户案例

基于飞天大数据平台产品DataWorks+MaxCompute大大提高了数据业务的开发效率，构建大润发的数据中台体系。新金融行业：某互联网金融公司湖仓一体案例客户架构如下。客户简介公司的第一代数据湖是基于Hadoop+OSS搭建的，同时引入的数据中台...

应用场景

背景信息设备将原始数据通过 MQTT 协议发送到物联网平台，经由物联网平台将数据转发到消息服务系统，继而通过流计算系统对这些数据进行实时计算处理后写入到 TSDB 中存储，或者经由物联网平台直接将原始数据写入 TSDB 中存储。前端的监控...

DataWorks数据服务对接DataV最佳实践

DataV通过与DataWorks数据服务的对接，通过交互式分析Hologres连接DataWorks数据服务开发并生成API，快速在DataV中调用API并展现MaxCompute的数据分析结果。数据服务对接DataV产生背景 MaxCompute是阿里巴巴集团自主研究的快速、完全托管的...

数仓分层

在阿里巴巴的数据体系中，我们建议将数据仓库分为三层，自下而上为：数据引入层（ODS，Operation Data Store）、数据公共层（CDM，Common Data Model）和...而DWS层和ADS层的数据通常会落地到在线存储系统中，下游通过接口调用的形式使用。

数仓分层

在阿里巴巴的数据体系中，我们建议将数据仓库分为三层，自下而上为：数据引入层（ODS，...而DWS层和ADS层的数据通常会落地到在线存储系统中，下游通过接口调用的形式使用。icmsDocProps={'productMethod':'created','language':'zh-CN',};

创建全球数据库网络

全球数据库网络（Global Database Network，简称GDN）是由分布在同一个国家不同地域的多个 PolarDB 集群组成的网络，网络中所有集群的数据均保持同步。当您的业务部署在多个地域时，利用GDN可以实现应用访问数据库的低延迟和高稳定性。本文...

我的看板

数据来源在工作台中创建并发布的数据看板内容，会同步在此处展示，若数据看板仅编辑完成，但是未发布，则在此处不展示。如需编辑某一看板内容，请单击页面右上角的前往可视化工作台，编辑并发布对应数据看板后，刷新当前页面即可。操作...

添加 MySQL 数据源的白名单

进入云服务器 ECS 控制台的安全组页面，在创建安全组右侧的下拉列表中选择专有网络 ID，粘贴 VPC ID 筛选安全组。单击目标安全组的名称，进入详情页面。在入方向快速添加 IP 地址。复制 OMS 控制台添加数据源对话框中显示的 ...

应用场景

可以将访问频度非常高的数据存储在云数据库 Memcache 版中，底层数据存储在 RDS 中。大型促销类业务大型促销秒杀系统，系统整体访问压力非常大。一般的数据库根本无法承载这样的读取压力，可选用云数据库 Memcache 版存储。带有计数器的...

管理缓存

Alluxio利用E-MapReduce（简称EMR）集群的本地节点的内存和磁盘对数据进行分布式缓存。本文为您介绍缓存相关的内容。前提条件已创建集群，并选择了Alluxio服务，详情请参见创建集群。已登录集群，详情请参见登录集群。背景信息 EMR默认...

按应用关联

根据应用关联对应资源信息，选中目标应用后，系统自动选中关联此应用的上线API、有产出关系的场景、场景下包含的所有场景节点以及场景节点包含的所有逻辑表以及数据标准、数据源和全局配置。说明工作组若有创建数据标准、数据源和全局变量...

添加 Oracle 数据源的白名单

进入云服务器 ECS 控制台的安全组页面，在创建安全组右侧的下拉列表中选择专有网络 ID，粘贴 VPC ID 筛选安全组。单击目标安全组的名称，进入详情页面。在入方向快速添加 IP 地址。复制 OMS 控制台添加数据源对话框中显示的 ...

冷热分离

背景信息在海量大数据场景下，一张表中的部分业务数据随着时间的推移仅作为归档数据或者访问频率很低，同时这部分历史数据体量非常大，比如订单数据或者监控数据，降低这部分数据的存储成本将会极大的节省企业的成本。因此，如何以极简的...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明上图中，虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示：数据产生：业务系统每天会产生大量结构化的...

按线上API关联

手动选中目标服务后，系统自动选中API的归属应用、和API关联的物理表、和API关联物理表有产出关系的场景、场景下包含的所有场景节点、场景下输出的物理表，以及场景节点包含的所有逻辑表，以及场景节点包含的所有逻辑表以及数据标准、数据...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力，本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库本场景推荐的架构如下。适用行业：全行业...

API概览

AttachDbfs 挂载数据库文件系统调用AttachDbfs为一台ECS实例挂载一个按量付费的数据库文件系统。ECS实例和数据库文件系统必须在同一个可用区内。DetachDbfs 卸载数据库文件系统调用DetachDbfs从一台ECS实例上卸载一个按量付费的数据库...

未来规划

云计算架构的核心逻辑就是通过虚拟化技术带来池化资源，云原生数据库采用分布式数据库架构，实现大规模扩展，每套数据库系统横跨多台服务器和虚拟机，带来了全新的系统管理挑战。其中最核心的挑战就是如何实现弹性以及高可用，实现按需按量...

异地备份方案概览

NoSQL 数据库类型推荐方案方案方案特点云Redis数据库自建Redis数据库其他云厂商的Redis数据库云MongoDB数据库自建MongoDB数据库其他云厂商的MongoDB数据库推荐在DBS进行逻辑备份。通过公网将数据库实例进行异地备份，详情请参见...

结束数据迁移任务

对于需要停止或迁移失败（不再需要）的任务，您可以结束数据迁移任务，避免源数据库的数据覆盖写入至目标数据库中。前提条件数据迁移任务处于迁移中、已暂停、迁移失败状态。影响结束数据迁移任务后，数据迁移任务将处于已完成状态，...

修改数据库密码

说明若数据传输控制台自动跳转至数据管理DMS控制台，您可以在右下角的中单击，返回至旧版数据传输控制台。根据实例类型，在左侧导航栏单击数据迁移、数据同步或数据订阅。在页面顶部选择实例所属地域。找到目标实例，单击实例ID。根据...

MaxCompute数据迁移至OSS

本文为您介绍如何使用DataWorks的数据同步功能将MaxCompute数据迁移至对象存储OSS（Object Storage Service）。前提条件开通MaxCompute和DataWorks。在DataWorks上完成创建业务流程，本例使用DataWorks简单模式。详情请参见创建业务流程...

大数据互联网中台系统

新品推荐