阿里云文档 2025-04-03

如何通过ES-Hadoop实现Spark读写阿里云Elasticsearch数据

Spark是一种通用的大数据计算框架,拥有Hadoop MapReduce所具有的计算优点,能够通过内存缓存数据为大型数据集提供快速的迭代功能。与MapReduce相比,减少了中间数据读取磁盘的过程,进而提高了处理能力。本文介绍如何通过ES-Hadoop实现Hadoop的Spark服务读写阿里云Elasticsearch数据。

文章 2024-03-21 来自:开发者社区

阿里云 EMR Serverless Spark 版免费邀测中

随着大数据应用的广泛推广,企业对于数据处理的需求日益增长。为了进一步优化大数据开发流程,减少企业的运维成本,并提升数据处理的灵活性和效率,阿里云开源大数据平台 E-MapReduce (简称“EMR”)正式推出 EMR Serverless Spark 版,并已开启邀测! 立即申请 以强大的 Spark Native Engine 为基础,阿里云 EMR Se...

阿里云 EMR Serverless Spark 版免费邀测中
问答 2024-02-25 来自:开发者社区

阿里云E-MapReduce中在spark里使用jingdo访问oss, 是啥原因?

阿里云E-MapReduce中在spark里使用jingdo访问oss, 出现400 请求错误, 是啥原因? spark-3.4.2, jindosdk-6.3.0. 谢谢。是版本问题么?24/02/20 13:40:57 INFO SQLHadoopMapReduceCommitProtocol: Using output committer class org.apache.hadoop......

问答 2023-11-19 来自:开发者社区

问下阿里云E-MapReduce spark-shell有SDK 报错找不到schema?

Caused by: org.apache.hadoop.hive.metastore.api.MetaException: Got exception: org.apache.hadoop.fs.UnsupportedFileSystemException No FileSystem for scheme "oss" at org.apache.hadoop.hive.metastore.a.....

问答 2023-11-12 来自:开发者社区

阿里云E-MapReduce 4.6.12spark IDE 是不支持跑在Windows上吗?

阿里云E-MapReduce 4.6.12spark IDE 是不支持跑在Windows上吗?java.lang.RuntimeExce ption: Jindo Native loading failed: The platform is not support or jindo-core-$extends.jar is not install

文章 2023-09-05 来自:开发者社区

深度干货|谈谈阿里云AnalyticDB Spark如何构建低成本数据湖分析

文/李少锋阿里云瑶池旗下的云原生数据仓库AnalyticDB MySQL版是基于湖仓一体架构打造的实时湖仓。本文将分享AnalyticDB MySQL Spark助力构建低成本数据湖分析的最佳实践。全文目录:AnalyticDB MySQL介绍AnalyticDB MySQL Serverless Spark核心优化基于AnalyticDB MySQL湖仓版的最佳实践*文章转载自DataFunT....

深度干货|谈谈阿里云AnalyticDB Spark如何构建低成本数据湖分析
问答 2022-08-02 来自:开发者社区

阿里云在哪些国际Region 推出了 Spark 服务?

阿里云在哪些国际Region 推出了 Spark 服务?

文章 2022-02-15 来自:开发者社区

阿里云一键部署 Spark 分布式集群

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎,可以完成各种各样的运算,包括 SQL 查询、文本处理、机器学习等,而在 Spark 出现之前,我们一般需要学习各种各样的引擎来分别处理这些需求。本文主要目的是为大家提供一种非常简单的方法,在阿里云上部署Spark集群。 通过<阿里云ROS资源编排服务>,将VPC、NAT Gateway、ECS创建,Hadoop和....

阿里云一键部署 Spark 分布式集群
文章 2021-12-04 来自:开发者社区

阿里云天池Apache Spark落幕:AI医疗进入落地实践深水期,达摩院如何用生态破局?

10 月 10 日,AI 医疗行业最高规格赛事——阿里云、英特尔(中国)有限公司联合主办的 Apache Spark AI 在杭州落下帷幕。脊柱外科疾病已经越来越困扰着老年人及久坐的上班一族,脊柱病变发展缓慢且不明显,长此以往会压迫神经和血管,甚至造成大脑指挥失灵。此次比赛正是瞄准脊柱外科疾病,参与者需要提供提供全自动算法来定位锥体、椎间盘的位置和相应分类以帮助筛查病例。比赛历时 121 天,覆....

阿里云天池Apache Spark落幕:AI医疗进入落地实践深水期,达摩院如何用生态破局?
文章 2020-10-10 来自:开发者社区

阿里云云原生数据湖分析DLA Serverless Spark重磅发布,助力企业低成本挖掘OSS数据价值

一、背景概述 1.1 什么样的客户需要数据湖 在数据处理领域,数据湖相对来说是一个比较新的概念,它的提出可以很好地帮助企业应对当前数据场景越来越多、数据结构越来越复杂、数据处理的需求越来越多样化的问题。传统的单机数据库技术倾向于大一统,一个数据库可以解决数据存储、在线交易、在线分析、离线报表等功能,好处是简单,数据只有一份,缺点是各个功能都做了取舍,很难解决规模的问题。为了突破数据规模的瓶颈,大....

阿里云云原生数据湖分析DLA Serverless Spark重磅发布,助力企业低成本挖掘OSS数据价值

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注