计算设置概述

计算引擎 说明 操作文档 离线计算引擎 MaxCompute 阿里原生的大数据计算平台,承载海量数据存储与计算能力,高效率与高稳定性。设置Dataphin实例的计算引擎为MaxCompute AnalyticDB for PostgreSQL 专注于OLAP领域的分析型数据库,是云端...

计算设置概述

计算引擎 说明 操作文档 离线计算引擎 MaxCompute 阿里原生的大数据计算平台,承载海量数据存储与计算能力,高效率与高稳定性。设置Dataphin实例的计算引擎为MaxCompute 实时计算引擎 阿里云实时计算Flink 阿里云新一代计算引擎Flink,支持...

外部表概述

随着大数据业务的不断扩展,新的数据使用场景在不断产生,MaxCompute计算框架也在不断演化。MaxCompute原来主要面对内部特殊格式数据的强大计算能力,正一步步地开放给不同的外部数据。现阶段MaxCompute SQL处理的主要是以 cfile 列格式...

数据类型版本说明

MaxCompute目前提供了三种不同类型的数据类型版本,包括1.0数据类型、2.0数据类型以及Hive兼容数据类型,您可以根据业务需求选择合适的数据类型版本。本文为您介绍三种数据类型版本、选择数据类型版本以及查看和修改项目的数据类型版本。...

Tablestore外部表

注意事项 MaxCompute与Tablestore是两个独立的大数据计算和存储服务,所以两者之间的网络必须保证连通性。MaxCompute公共云服务访问Tablestore存储时,推荐您使用Tablestore私网地址,即Host名以 ots-internal.aliyuncs.com 作为结尾的地址...

RDS搭配大数据计算服务实现规模数据计算

本文介绍RDS MySQL如何结合大数据计算服务MaxCompute使用。开放数据处理服务又称为大数据计算服务(MaxCompute,原名ODPS),可服务于批量结构化数据的存储和计算,提供海量数据仓库解决方案以及针对数据的分析建模服务。通过 数据集成 ...

ECS资源复用版

在 关联资源使用者 页面,使用者类型 选择 云服务主体,使用者信息 选择 云原生大数据计算服务 MaxCompute,选择 每日共享时间段(默认为全天),单击 添加,然后单击 下一步。重要 共享单元创建成功后 不支持修改 共享时间段,请谨慎选择...

计量计费

本文为您介绍如何估算MaxCompute SQLML作业的费用。背景信息 通常情况下,每个算法组件由多个子任务组成。...查看账单信息 MaxCompute SQLML作业,在账单中体现的是 大数据计算服务MaxCompute+机器学习(PAI)两个产品的费用。

客户案例

MaxCompute已被广泛应用于各领域处理云上大数据,帮助众多企业解决了海量数据分析问题,同时降低企业运维成本,企业人员可更专注于业务开发。本文为您介绍MaxCompute的精选客户案例。MaxCompute的全量客户案例信息,请参见 行业客户案例...

基本概念

M MaxCompute 大数据计算服务MaxCompute(原名ODPS)是一种快速、完全托管的TB、PB级数据仓库解决方案,提供了完善的数据导入方案以及多种经典的分布式计算模型,能够快速地解决海量数据计算问题。通过数据集成服务,可将Lindorm数据导入...

查询执行模式

相比较于全内存计算的 Interactive 模式,Batch 模式可以对查询的任务进行分批执行,每个子任务在内存不足的情况下,自适应地将内存数据换出到磁盘,降低数据计算的成本,提升数据处理的容量上限。Interactive模式 AnalyticDB MySQL 接收到...

计费常见问题

SQL作业的费用计算方式为 输入数据量×复杂度×单价,因此在复杂度和单价不变情况下,输入数据量越费用越高。MaxCompute作业跑失败了会收费吗?MaxCompute有两种计费模式:按量计费:如果作业是按照按量计费进行运行的,当运行失败后,...

函数

自定义函数(UDF):为MaxCompute提供了高度的灵活性,允许您根据具体业务逻辑进行定制化的数据计算和分析。自定义函数(UDF)可以进一步分为标量值函数(UDF)、自定义聚合函数(UDAF)和自定义表值函数(UDTF)三种类型。您在开发完成UDF...

使用MaxCompute控制台(离线)

查看上传记录 提交上传后,若数据量较,需要耗费一些时间,您无需在提交页面一直等待,可后续通过单击 数据上传 页面右上角的 查看上传记录 查看通过该功能上传数据的详情记录。说明 通过该页面的 查看上传记录 查询到的记录详情也包含...

基本概念

实例 实例是指用户创建的针对多个数据进行同一类型AI计算所创建的一个计算任务。设备 设备指IPC、NVR等能产生视频数据的相关设备,该设备同时符合GB/T28181-2016、GA/T1400协议,或者集成阿里云VCS SDK。设备接入 设备接入是指用户需要计算...

创建数据板块

如果您管理诉求较强,数据研发人员较多且能力及分工明确,数据计算存储预算较高,推荐 此模式。创建Dev-Prod模式数据板块,请参见 创建Dev-Prod模式数据板块。Basic模式 生成独立的Basic数据板块,数据生产过程稳定且便捷。如果您关注数据...

创建数据板块

如果您管理诉求较强,数据研发人员较多且能力及分工明确,数据计算存储预算较高,推荐 此模式。创建Dev-Prod模式数据板块,请参见 创建Dev-Prod模式数据板块。Basic模式 生成独立的Basic数据板块,数据生产过程稳定且便捷。如果您关注数据...

名词解释

提供安全可靠的数据计算能力,可供本地处理设备数据,减少上传云端的成本。Link IoT Edge软件包 阿里云IoT的边缘计算产品软件包,包含Link IoT Edge轻量版、标准版、专业版软件包。LE Lite Link IoT Edge轻量版,以二进制 tar.gz 的方式...

使用DataWorks

MaxCompute支持通过DataWorks的数据集成功能将MaxCompute中的数据以离线方式导出至其他数据源。当您需要将MaxCompute中的数据导出至其他数据源执行后续数据处理操作时,您可以使用数据集成功能导出数据。本文为您介绍如何将MaxCompute的...

羲和分析计算引擎

相对于传统的以数据为中心的计算方式,面向算子为中心的计算方式对现代CPU计算更友好:缓存友好的同时,利用乱序执行扩大了CPU的指令并发,利用SIMD又扩大CPU的数据并发,充分挖掘了现代CPU的算力。面向混合负载的查询执行 羲和分析计算...

数据传输费用(公网下载)

本文介绍MaxCompute中数据下载计费规则。MaxCompute仅对公网的下载数据进行收费,并按照下载的数据大小按量计费。MaxCompute会在第二天给出您的下载费用账单,您可以进入 费用中心 查看。下载计费规则如下。计费公式 价格 说明 一次下载...

数据质量保障原则

一致性 一致性通常体现在跨度很大的数据仓库中。例如,某公司有很多业务数仓分支,对于同一份数据,在不同的数仓分支中必须保证一致性。例如,从在线业务库加工到数据仓库,再到各个数据应用节点,用户ID必须保持同一种类型,且长度也要...

基本概念

本文列出了蚂蚁隐私计算服务平台涉及的基本概念,以便于您更好地理解产品。安全配置 安全配置全称为授权安全配置,离线样本被授权到多方安全分析项目后,数据所有方在项目中按照安全级别对数据进行分列、分级的配置。数据的安全性越高,对...

存储费用

MaxCompute会对存储的数据(例如表或资源)及备份的数据,按照数据容量大小进行计费。本文为您介绍存储费用的计费规则。背景信息 MaxCompute数据的压缩比一般在5倍左右,因此多数情况下,您上传的数据文件大小与实际存储在MaxCompute的大小...

导入导出表数据

MaxCompute Studio可以将CSV、TSV等格式的本地数据文件导入至MaxCompute表中,也可将MaxCompute表中的数据导出到本地文件。MaxCompute Studio通过Tunnel导入导出数据。前提条件 导入导出数据使用MaxCompute Tunnel,因此要求MaxCompute ...

开发Dataphin数据源并加速数据查询

开发Dataphin数据源即将Dataphin中的逻辑表和物理表配置为供应用调用的Dataphin数据源,同时您可以为已开发的Dataphin数据源所在的计算空间添加Hologres加速计算源,以满足对查询速度有要求的业务场景。本文为您介绍如何开发Dataphin数据源...

DataWorks V3.0

MaxCompute:大数据计算服务MaxCompute(原ODPS)是一种快速、完全托管的EB级大数据计算引擎,是规模离线数据仓库的核心引擎。MaxCompute是DataWorks最早支持,且最成熟完备的计算引擎,目前已基本覆盖MaxCompute的所有功能。详情请参见 ...

迁移服务(MMA)

MaxCompute提供的数据迁移服务支持通过MMA(MaxCompute Migration Assist)服务,将Hive数据安全且高效地迁移到MaxCompute。迁移流程 使用限制 不支持迁移Hive数据至已开启Schema功能的MaxCompute项目。关于Schema介绍详情,请参见 Schema...

MaxCompute数据迁移

本文为您介绍MaxCompute数据迁移的准备事项和操作步骤。准备事项 同Region项目迁移。要求有能够同时访问源项目和⽬的项目的账号,该账号对源项目和⽬的项目有List、建表,读写表权限。EMR+DLF+OSS迁移MaxCompute。需要先构建MaxCompute的湖...

SDK接口

本文为您介绍流式数据通道SDK接口的使用方法。使用说明 您可以基于MaxCompute Studio通过Java SDK使用MaxCompute流式数据通道服务。您可以使用以下配置在MaxCompute Studio上添加指定版本的pom依赖。groupId>...

准备环境

为保证您可以顺利完成本次实验,请您首先确保自己云账号已开通大数据计算服务MaxCompute、数据工场DataWorks和 人工智能平台 PAI。前提条件 注册阿里云账号,详情请参见 注册阿里云账号。实名认证,详情请参见 个人实名认证 背景信息 本次...

支持的连接器

MySQL√流模式 SQL和DataStream 是 云数据库RDS MySQL版×流模式和批模式 SQL 是 大数据计算服务MaxCompute√流模式和批模式 SQL和DataStream 不支持更新和删除结果表数据,只支持插入数据。数据总线DataHub√流模式和批模式 SQL和...

产品简介

DLA Ganos是基于云原生数据湖分析(Data Lake Analytics,DLA)系统设计开发的,面向时空大数据存储与计算数据引擎产品。基于DLA无服务器化(Serverless)数据湖分析服务与内置的Spark计算引擎,DLA Ganos打通了阿里云各个存储系统,如...

选择付费方式

对周期性高密度计算作业使用包年包月模式,对非周期性的规模数据处理作业使用按量计费模式。按量计费模式下可以不存储数据,通过读取其它账号下的表获取数据,从而可以节省数据存储费用。不同账号下跨表计算需要通过授权来实现,详细请...

应用场景

本文将以部门场景和技术领域场景为例,为您介绍实时计算Flink版的大数据是实时化场景。说明 更多场景案例请参见 阿里云实时计算Flink版产品案例和解决方案汇总。背景信息 作为流式计算引擎,Flink可以广泛应用于实时数据处理领域,例如ECS...

UDAF概述

在SQL语句中使用自定义函数时,如果计算数据量过并且存在倾斜,会导致作业占用的 内存超出默认分配的内存。此时,您可以在Session级别设置 set odps.sql.udf.joiner.jvm.memory=xxxx;属性来解决此问题。更多自定义函数常见问题,请参见...

基于混合负载的查询优化

Batch模式:采用批计算架构,通过DAG进行任务切分,分批调度,满足有限资源下大数据计算,支持计算数据落盘,适用于计算,吞吐高的复杂分析场景。资源池混合负载隔离 AnalyticDB MySQL版弹性版本支持资源池多租户隔离。通过一个实例...

通过选择已有表新建数据

数据源中引入业务所需的数据集,以便在模型画布中编辑业务模型时使用数据集。本文介绍如何通过选择已有表新建数据集。前提条件 已创建云计算资源,并通过查看云计算资源的物理表更新缓存表。具体操作,请参见 新建计算资源。背景信息 ...

配置资源组与网络连通

数据同步任务配置前,您需要确保用于执行同步任务的独享数据集成资源组与您将要同步的数据来源端与目的端数据库的网络连通性,您可以根据数据库所在网络环境,选择合适的网络解决方案来实现网络连通。本文为您介绍数据库在不同网络环境中...

观远BI连接MaxCompute

MaxCompute支持您将MaxCompute项目数据接入观远BI,帮助企业的业务人员和数据分析师开展以问题为导向的探索式分析工作以及制作数据卡片和数据看板。本文为您介绍如何通过MaxCompute JDBC驱动,连接观远BI和MaxCompute项目,并进行可视化...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 数据传输服务 实时计算 Flink版 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用