阿里云文档 2025-10-16

Serverless Spark 提供多种内置函数,包括兼容开源函数和特有函数,用于高效处理数据,如 PARQUET_SCHEMA、PARQUET_METADATA、URL_DECODE 等,支持复杂数据操作与解析。

Serverless Spark 内置了多种函数,能够满足大部分数据处理需求。本文将为您介绍 Serverless Spark 内置提供的函数及其使用说明。

阿里云文档 2025-10-10

本方案通过阿里云OSS实现HDFS数据跨可用区冷备与快速恢复,保障业务连续性。

单可用区故障可能导致 HDFS 数据丢失及服务中断。本方案通过 OSS 跨可用区存储实现定期冷备,以便在故障发生时迅速启动新的集群并恢复数据,从而保障业务的连续性。

阿里云文档 2025-09-19

导入数据常见问题

本文汇总了StarRocks数据导入的常见问题。

阿里云文档 2025-05-07

HBase在线迁移数据

本方案通过结合HBase Snapshot和HBase Replication技术,在源端HBase集群不停服的情况下,实现存量数据和增量数据的在线迁移,确保迁移过程中数据无丢失。

阿里云文档 2024-10-08

查询外部数据

本文介绍如何通过External Catalog查询外部数据。External Catalog方便您轻松访问并查询存储在各类外部源的数据,无需创建外部表。

问答 2022-04-15 来自:开发者社区

E-MapReduce产品sqoop把数据导入hdfs一个目录还是hive的一个表中,这两种有区别吗

E-MapReduce产品sqoop把数据导入hdfs一个目录还是hive的一个表中,这两种有区别吗

文章 2022-02-15 来自:开发者社区

使用E-MapReduce服务将Kafka数据导入OSS

概述 kafka是一个开源社区常用的消息队列,虽然kafka官方(Confluent公司)提供插件从Kafka直接导入数据到HDFS的connector,但对阿里云对文件存储系统OSS却没有官方的支持。本文会举一个简单的例子,实现kafka的数据写入阿里云OSS。因为阿里云E-MapReduce服务集成了大量开源组件和阿里云产品的对接工具,所以本文直接在E-MapReduce集群上运行这个例子。....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐