阿里云文档 2025-12-09

系统规则模板和自定义规则模板

为了减少书写Spec时的工作量,数据质量提供了数据质量规则模板能力,系统内置了一批常用的规则模板,您也可以创建自定义的规则模板,这些模板中固化了Spec所需的大部分设置。在使用模板创建规则时,只需要在模板基础之上,设置额外的配置即可。

阿里云文档 2025-08-22

订阅Serverless Spark工作流系统事件通知

EMR Serverless Spark已接入云监控平台,您可以通过事件订阅对重要的事件设置定制化的报警通知,让您及时了解事件的发生与进展,帮助您实时掌握事件动态,便于您在业务故障时快速分析并定位问题。

阿里云文档 2025-08-19

支持的预设的系统权限策略列表

本文描述云原生大数据计算服务 MaxCompute支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。

阿里云文档 2025-06-27

DataWorks中EMR Serverless Spark版本的用户画像分析的加工数据阶段

本文为您介绍如何用Spark SQL创建外部用户信息表ods_user_info_d_spark以及日志信息表ods_raw_log_d_spark访问存储在私有OSS中的用户与日志数据,通过DataWorks的EMR Spark SQL节点进行加工得到目标用户画像数据,阅读本文后,您可以了解如何通过Spark SQL来计算和分析已同步的数据,完成数仓简单数据加工场景。

阿里云文档 2024-11-01

支持的预设的系统权限策略列表

本文描述EMR Workbench支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。

文章 2023-05-20 来自:开发者社区

大数据开发基础的Linux系统的基本的服务/软件部署

服务的部署在Linux系统中,可以通过服务来实现某些功能。下面列举一些常用的服务:(1)Apache:用于搭建Web服务器。(2)MySQL:用于管理数据库。(3)Nginx:用于搭建反向代理服务器。(4)Tomcat:用于运行Java Web应用程序。(5)Redis:用于提供缓存服务。软件的部署除了服务外,还有一些软件可以用于辅助大数据开发工作。下面列举一些常用的软件:(1)Hadoop:用....

文章 2023-05-18 来自:开发者社区

大数据开发基础的Linux系统的系统安装部署

系统选择在开始安装之前,您需要选择服务器所需要的Linux系统版本。在大数据开发领域,常见的Linux系统版本包括CentOS、Ubuntu、Debian等。其中,CentOS是最受欢迎的一个选项,因为它非常稳定,并且可以免费获取。下载和制作启动盘下载所需的Linux系统镜像文件后,您需要将其写入到启动盘中。这可以通过ISO文件刻录到DVD或USB设备中来实现。您可以使用诸如Rufus、UNet....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute系统相关内容

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注