阿里云文档 2026-04-25

用户画像分析案例加工数据-基于新版数据开发和Spark计算资源

本文为您介绍如何用Spark SQL创建外部用户信息表ods_user_info_d_spark以及日志信息表ods_raw_log_d_spark访问存储在私有OSS中的用户与日志数据,通过DataWorks的EMR Spark SQL节点进行加工得到目标用户画像数据,阅读本文后,您可以了解如何通过Spark SQL来计算和分析已同步的数据,完成数仓简单数据加工场景。

阿里云文档 2026-04-23

用户画像分析案例同步数据-基于新版数据开发和Spark计算资源

本文将介绍如何创建HttpFile和MySQL数据源以访问用户信息和网站日志数据,配置数据同步链路将这些数据同步到在环境准备阶段创建的OSS存储中,并通过创建Spark外表解析OSS中存储的数据。通过查询验证数据同步结果,确认是否完成整个数据同步操作。

阿里云文档 2026-04-22

基于MaxCompute UDF进行SQL分析

面对MaxCompute无法直接调用外部API的限制,本文将通过一个完整的实践案例,教您如何利用“离线IP库+UDF”的方案,在MaxCompute中高效地实现IP地址归属地分析。

阿里云文档 2026-04-15

用户画像分析案例环境准备-基于新版数据开发和Spark计算资源

本教程以用户画像为例,在华东2(上海)地域演示如何使用DataWorks完成数据同步、数据加工和质量监控的全流程操作。为了确保您能够顺利完成本教程,您需要准备教程所需的EMR Serverless Spark空间、DataWorks工作空间,并进行相关的环境配置。

阿里云文档 2026-03-13

使用X-分析通过自然语言智能问答查找资产和获取SQL-智能数据建设与治理 Dataphin-阿里云

智能分析接入阿里云(百炼)、DeepSeek等AI大模型平台,使用自然语言进行问答,帮助您高效便利地查找所需资产,获取SQL分析思路,并提供SQL示例。本文为您介绍如何使用X-分析助手。

文章 2025-06-20 来自:开发者社区

Java 大视界 -- Java 大数据在智能教育学习社区用户互动分析与社区活跃度提升中的应用(274)

@TOC 引言: 嘿,亲爱的 Java 和 大数据爱好者们,大家好!在国家智慧教育公共服务平台的运营大屏上,Java 驱动的大数据分析系统正以毫秒级速度解析全国 1.2 亿学习者的互动行为。当系统捕捉到 “Python 数据分析” 课程板块的用户提问量在 1 小时内激增 400% 时,基于 Java 微服...

Java 大视界 -- Java 大数据在智能教育学习社区用户互动分析与社区活跃度提升中的应用(274)
文章 2023-06-12 来自:开发者社区

【大数据学习篇7】小试牛刀统计并且分析天猫数据(下)

4.5 统计前10名省退款总额,写入数据库。 4.5.1 网站效果:统计前10名省退款总额 4.6 统计每个省的订单数,写入数据库4.6.1 网站效果:统计每个省的订单数4.7  统计每个省的退款数,写入数据库。 4.7.1 网站效果:统计统计每个省的退款数4.8 统计每个省成效率,写入数据库 4.8.1 网站效果:统计每个省成效率 5. 构造,完善主页加入了跳转,音乐,轮播图等应用 ....

【大数据学习篇7】小试牛刀统计并且分析天猫数据(下)
文章 2023-06-12 来自:开发者社区

【大数据学习篇9】各区域热门商品Top3分析

学习目标/Target掌握各区域热门商品Top3分析实现思路掌握如何创建Spark连接并读取数据集掌握利用Spark获取业务数据掌握利用Spark过滤商品的行为类型掌握利用Spark转换数据格式掌握利用Spark统计每个区域中的不同商品掌握利用Spark根据区域进行分组掌握利用Spark根据区域内商品的查看次数进行排序掌握将数据持久化到HBase数据库熟悉通过Spark On YARN运行程序 ....

【大数据学习篇9】各区域热门商品Top3分析
文章 2023-06-12 来自:开发者社区

【大数据学习篇8】 热门品类Top10分析(下)

创建项目目录在项目SparkProject中新建Package包。        在“New Package”窗口的文本输入框“Enter new package name”中输入“cn.itcast.top10”设置Package名称,用于存放实现热门品类Top10分析的类文件。在Package包“cn.itcast.top10”新建类。   ....

【大数据学习篇8】 热门品类Top10分析(下)
文章 2023-06-12 来自:开发者社区

【大数据学习篇8】 热门品类Top10分析(上)

在HBase命令行工具中执行“list”命令,查看HBase数据库中的所有数据表。学习目标/Target掌握热门品类Top10分析实现思路掌握如何创建Spark连接并读取数据集掌握利用Spark获取业务数据掌握利用Spark统计品类的行为类型掌握利用Spark过滤品类的行为类型掌握利用Spark合并相同品类的行为类型掌握利用Spark根据品类的行为类型进行排序掌握将数据持久化到HBase数据库熟....

【大数据学习篇8】 热门品类Top10分析(上)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute分析相关内容

云原生大数据计算服务 MaxCompute更多分析相关

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注