阿里云文档 2025-12-26

API开发流程

DataWorks数据服务模块是一个灵活轻量、安全稳定的数据API构建平台,作为数据库和数据应用之间的“桥梁”,DataWorks数据服务旨在为个人、团队和企业提供全面的数据服务和共享能力,帮助用户统一管理面向内外部的API服务。例如,您可以将查询数据表功能快速的生成对应的API,或将已有的API注册至数据服务平台进行统一发布和管理。

阿里云文档 2025-12-22

如何使用数据保护伞功能

数据保护伞是一款数据安全管理产品,提供数据发现、数据脱敏、数据水印、风险识别、数据溯源等功能,帮助您快速梳理敏感数据并进行安全管控,保障数据安全。本文示例使用内置规则对xc_dpe_e2_dev项目的phone数据脱敏,并设置导出风险审计,为您演示数据保护伞的基本使用流程。

阿里云文档 2025-09-03

如何使用运维中心模块

您可在运维中心查看发布至生产环境的任务,并执行测试、补数据等相关运维操作。本文以周期调度任务的运维为例,通过确认调度任务的配置是否符合预期、使用补数据计算历史时间段的数据、配置任务的智能监控规则,保障任务后续可以正常调度,为您介绍运维中心模块的基本使用。

阿里云文档 2025-07-30

PySpark批任务开发入门

您可以自行编写并构建包含业务逻辑的Python脚本,上传该脚本后,即可便捷地进行PySpark开发。本文通过一个示例,为您演示如何进行PySpark开发。

文章 2024-06-12 来自:开发者社区

大数据之hadoop3入门到精通(一)

hadoop3.x搭建学习 Hadoop概述 什么是hadoop? 1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 2)主要解决,海量数据的存储和海量数据的分析计算问题。 3)广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。 Hadoop四大特点 1)高可靠性:Hadoop底层维护多个数据副本...

文章 2024-06-12 来自:开发者社区

大数据之hadoop3入门到精通(三)

大数据之hadoop3入门到精通(二);https://developer.aliyun.com/article/1535226 HDFS—核心参数 NameNode 内存生产配置 1)NameNode 内存计算 每个文件块大概占用 150byte,一台服务器 128G 内存为例,能存储多少文件块呢? 128 * 1024 * 1024 * 1024 / ...

文章 2024-06-12 来自:开发者社区

大数据之hadoop3入门到精通(二)

大数据之hadoop3入门到精通(一):https://developer.aliyun.com/article/1535224 常见错误及解决方案 1)防火墙没关闭、或者没有启动 YARN INFO client.RMProxy: Connecting to ResourceManager at hadoop108/192.168.10.108:8032 ...

阿里云文档 2023-07-06

SparkStreaming如何消费LogService中的日志数据和统计日志条数

本文介绍Spark Streaming如何消费Log Service中的日志数据和统计日志条数。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注