互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

文档修订记录

QueryPublicModelEngine 2023.10.20 新增功能 上传与下载 DataWorks的上传与下载模块,提供了便捷的数据上传功能,支持将多种来源(例如,本地文件、OSS文件)的数据上传至MaxCompute大数据引擎中进行分析处理及相关管理操作,致力于为您...

IoT数据自动化同步至云端解决方案

大数据分析是大数据完成数据价值化的重要手段之一,而进行大数据分析的第一步是让数据成功上云。解决方案 IoT数据自动化同步至云端解决方案主要包括存储原始数据和同步数据至分析系统两部分。IoT设备大量的数据通常以半结构化的形式存储。...

产品概述

阿里云流数据处理平台数据总线DataHub是流式数据(Streaming Data)的处理平台,提供对流式数据的发布(Publish),订阅(Subscribe)和分发功能,让您可以轻松构建基于流式数据的分析和应用。数据总线 DataHub服务可以对各种移动设备,应用...

大数据AI公共数据集分析

本教程通过DataWorks,联合云原生大数据计算服务MaxCompute,使用大数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等公共数据),指导您如何快速进行大数据分析,快速熟悉DataWorks的操作界面与最基础的数据分析能力。DataWorks的更...

基于MaxCompute进行大数据BI分析

本实践以电商行业为例,通过MaxCompute、DataWorks对业务数据和日志数据进行ETL处理,并同步至分析型数据库MySQL(AnalyticDB MySQL)进行实时分析,再通过Quick BI进行可视化展示。背景信息 MaxCompute:用于进行大规模数据计算,详情请...

概述

利用数据库中的表数据进行大语言模型推理的场景。导入模型目前仅支持TensorFlow模型(输入为一维数组或句子),支持的输出类型为INTEGER、REAL或STRING。使用限制 仅支持在 PolarDB MySQL版 8.0.2版本的 企业版 集群中使用该功能。费用 仅...

数据组织优化

Level0到Level1主要针对原始写入的DeltaFile(图中蓝色数据文件)合并为中等大小的DeltaFile(图中黄色数据文件),当中等大小的DeltaFile达到一定规模后,会进一步触发Level1到Level2的合并,生成更大的DeltaFile(图中橙色数据文件)。...

DataWorks数据服务对接DataV最佳实践

DataV通过与DataWorks数据服务的对接,通过交互式分析Hologres连接DataWorks数据服务开发并生成API,快速在DataV中调用API并展现MaxCompute的数据分析结果。数据服务对接DataV产生背景 MaxCompute是阿里巴巴集团自主研究的快速、完全托管的...

MaxFrame概述

您可以用更熟悉、高效、便捷的方式利用MaxCompute的海量计算资源及数据进行大规模数据处理、可视化数据探索分析以及科学计算、ML/AI开发等工作。本文为您介绍MaxFrame背景信息、功能介绍及使用场景。版本说明 当前MaxCompute MaxFrame功能...

质量规则模板类型

如果差异较,可能存在较大数据质量的问题需要进行确认和修复。实时多链路对比 高可用场景下,需要构建多条链路,以便数据出现异常时,能够及时切换。对于多链路之间的数据计算进度监控则可以发现一些数据滞留、统计偏差问题,提升实时...

质量规则模板类型

如果差异较,可能存在较大数据质量的问题需要进行确认和修复。实时多链路对比 高可用场景下,需要构建多条链路,以便数据出现异常时,能够及时切换。对于多链路之间的数据计算进度监控则可以发现一些数据滞留、统计偏差问题,提升实时...

ActionTrail日志清洗

DLA提供ActionTrail日志自动清洗解决方案,可以将ActionTrail投递到OSS的日志文件转换为DLA中可以直接查询的数据表,同时自动对数据进行分区和压缩,方便您分析和审计对云产品的操作日志。日志分析痛点 ActionTrail是阿里云提供的云账号...

概述

您可以通过客户端开发MaxCompute SQLML作业,基于 人工智能平台 PAI 对MaxCompute上的数据进行学习,并利用机器学习模型对数据进行预测,进而为业务规划提供指导。其中:MaxCompute:提供应用机器学习能力的SQL语言入口SQLML。客户端:SQL...

应用场景

数据库备份DBS 提供数据全量备份、增量备份、异地备份以及数据恢复等功能,帮助您实现多种典型应用场景。典型场景 应用场景 相关操作文档 备份安全 跨阿里云账号备份恢复数据 通过公网地址实现数据库跨账号备份 备份集自动归档到备份服务器...

产品优势

数据库自治服务DAS具备节约成本、提升稳定性、持续可用、安全高效等优点。节约成本 DAS提供统一监控功能、统一告警功能,您无需耗费人力和资源...DAS采用安全的数据链路,数据库的信息利用KMS进行加密存储,采用加密压缩传输,保障数据安全。

Quick BI

数据可视化分析 单击左侧导航栏中的 数据集>新建数据集,选择之前配置的AnalyticDB链接,选择表的种类,将数据集添加进数据决策系统并进行后续的数据分析和仪表板展示。您可以使用如下两种方式进行数据的可视化分析:拖拽表对应列方式:...

数据导入方式介绍

为满足多样化的数据导入需求,云原生数据仓库AnalyticDB MySQL版 提供了多种数据导入方式,包括:通过外表导入数据、使用DataWorks导入数据利用JDBC通过程序导入数据等。本文介绍各导入方式的特性及适用场景,帮助您选择正确的数据导入...

聚合支付方案

阿里云从业务扩展性、数据流动性、服务高可用三方面入手,通过多款云数据库产品为利楚扫呗制定聚合支付方案,解决利楚扫呗在业务扩展期遇到的数据存储空间不足、读写性能下降以及大数据分析空缺等问题。业务痛点 武汉利楚商务服务有限公司...

划分数据

数据仓库是面向主题(数据综合、归类并进行分析利用)的应用。数据仓库模型设计除横向的分层外,通常也需要根据业务情况纵向划分数据域。数据域是联系较为紧密的数据主题的集合,是业务对象高度概括的概念,目的是便于管理和应用数据。通常...

教程概述

本文档通过一个案例,演示了如何基于阿里云产品和服务实现设备数据在大屏上展示。本案例的原理如下:在设备端模拟两个字段,通过MQTT协议向阿里云物联网平台设备(高级版)发送数据。物联网平台接收到数据后通过规则引擎转发至DataHub。在...

应用场景

前端的监控系统和大数据处理系统会利用 TSDB 的数据查询和计算分析能力进行业务监控和分析结果的实时展现。电力化工及工业制造监控分析 传统电力化工以及工业制造行业需要通过实时的监控系统进行设备状态检测,故障发现以及业务趋势分析。...

表设计规范

单个分区中数据量较大的情况下,MaxCompute执行任务时会进行分片处理而不影响分区裁剪的优势。单个分区中文件数较多时,会影响MaxCompute Instance数量,造成资源浪费和SQL性能的下降。采用多级分区时,建议先按日期分区,然后按交易类型...

升级数据库版本

本文介绍云数据库MongoDB支持升级的数据版本以及如何升级数据版本。注意事项 升级分片集群实例的数据版本时,实例的协议类型需为 MongoDB协议。升级采用轮转升级的方式进行,升级过程中会自动对实例进行2~3次重启,请在业务低...

教程概述

案例使用阿里云DTS将您的增量数据同步到DataHub上,再通过阿里云实时计算Flink订阅DataHub的数据进行实时计算,并将结果插入到RDS数据库中,最终通过DataV大屏进行展示。说明 本案例仅提供具体的操作指导,业务场景和数据与实际情况会有...

实时同步常见问题

如果发生数据异常,可以重新进行全量数据初始化方案(只需要将中间加列的表剔除,然后重新进行数据初始化,不需要将整个任务所有表进行全量初始化),恢复正确数据。源表有默认值,通过数据集成创建的目标表,默认值、非空属性等会保留吗?...

索引优化

在大部分传统的TP型数据库中,索引可以极大的提高数据的访问效率。但是在类似与 AnalyticDB PostgreSQL版 这样的分布式数据库中,应该谨慎的选择索引的使用。在大部分场景下,AnalyticDB PostgreSQL版 更适合快速的顺序扫描,或者结合稀疏...

T+1多库合并建仓

上述方案可解决因数据而导致的用户体验问题,但在对分库分表数据进行大数据分析时,逻辑上的一个表被拆成了多张表,由于没有类似TDDL中间件来屏蔽物理表的拆分,进行数据分析时变得十分复杂。解决方案 T+1多库合并建仓是指通过DLA控制...

查询概述

数据库 SelectDB 版 高度兼容MySQL相关生态,支持湖仓一体化,并确保了上游与下游数据生态系统的无缝整合。本文介绍SelectDB在查询方面的能力概述。基础能力 云数据库 SelectDB 版 支持标准SQL语法,在SQL方言方面向MySQL兼容。采用MySQL...

配置数据过滤转换

数据过滤插件可以对数据进行规则过滤,例如过滤字段的大小等,符合规则的数据才会被保留。前提条件 配置数据过滤节点前,您需要先配置好相应的输入节点,详情请参见 实时同步支持的数据源。操作步骤 进入 数据开发 页面。登录 DataWorks...

羲和分析计算引擎

比如:利用数据分布,直接进行基于特定数据的计算,避免分布式系统中数据和命令流交互的开销。利用数据存储的能力,下推谓词、聚合等计算,实现近存储的计算加速。利用数据模型中的范式依赖,数据数值类型等进行查询执行算法优化。

划分数据

数据仓库是面向主题(数据综合、归类并进行分析利用的抽象)的应用。数据仓库模型设计除横向的分层外,通常也需要根据业务情况进行纵向划分数据域。数据域是联系较为紧密的数据主题的集合,是业务对象高度概括的概念层次归类,目的是便于...

数据可视化展现

本文为您介绍如何通过DataWorks数据分析实现用户画像数据可视化展示。前提条件 在开始试验前,请确认您已经完成了 加工数据。即已通过数据开发DataStudio将数据加工为用户画像基本数据数据分析场景 本案例通过数据分析对用户画像数据进行...

敏感数据保护

Dataphin支持敏感数据的识别和敏感数据的脱敏保护,可以结合权限管控方案一起,构建起完善的敏感数据保护体系。数据分类分级 Dataphin支持对数据的分类分级进行管理,内置了常用的个人信息数据分类,同时支持客户自定义企业的数据分类分级...

敏感数据保护

Dataphin支持敏感数据的识别和敏感数据的脱敏保护,可以结合权限管控方案一起,构建起完善的敏感数据保护体系。数据分类分级 Dataphin支持对数据的分类分级进行管理,内置了常用的个人信息数据分类,同时支持客户自定义企业的数据分类分级...

管理数据

说明 DMS数据分析在SQL执行成功后,会基于各个字段的SQL数据类型和执行结果数据推测出合适的数据集模型,即区分字段是维度还是度量,因此在SQL执行成功后,您可以对数据类型和可视化类型进行验证和调整(如将字段数据类型调整为国家、省份...

数据任务概述

Dataphin补数据任务可以对历史数据进行补数,将数据写入至对应时间分区。代码中若使用调度参数,则该参数将根据补数据时选择的业务日期自动替换为具体值,结合业务代码将对应时间数据写入对应分区。帮助您对数据中缺失、错误、重复或不完整...

数据任务概述

Dataphin补数据任务可以对历史数据进行补数,将数据写入至对应时间分区。代码中若使用调度参数,则该参数将根据补数据时选择的业务日期自动替换为具体值,结合业务代码将对应时间数据写入对应分区。帮助您对数据中缺失、错误、重复或不完整...

配置跨库Spark SQL节点

任务编排中的跨库Spark SQL节点,主要针对各类跨库数据同步和数据加工场景,您可以通过编写Spark SQL,完成各种复杂的数据同步或数据加工的任务开发。前提条件 支持的数据库类型:MySQL:RDS MySQL、PolarDB MySQL版、MyBase MySQL、...

实施步骤

步骤七:为大屏中的国家销售额排名组件配置数据 选中 销售额国家排名 组件,在 数据 页面进行参数配置。数据源类型:选择数据库。数据源:选择步骤二中添加的DLA数据源(dla_hangzhou_tpch)。SQL:输入以下SQL,按国家销售额降序排序。​...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 云数据库 Redis 版 云数据库 RDS 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用