问答 2024-01-09 来自:开发者社区

各位有没有遇到过spark sql查询hudi 数据时没有办法查到flink cdc ?

各位有没有遇到过spark sql查询hudi 数据时没有办法查到flink cdc 同步到hudi实时数据的变化,用hive是没有问题的。但是我重开一个spark sql客户端数据就能发现变化了?

问答 2023-09-06 来自:开发者社区

spark写Flink CDC创建的iceberg table 报错吗?

spark写Flink CDC创建的iceberg table 报错吗? 报错信息:Exception in thread "main" org.apache.spark.sql.AnalysisException: Cannot write nullable values to non-null column 'uid'

问答 2023-09-05 来自:开发者社区

spark写flink创建的iceberg table 报错吗?

有大佬知道 spark写flink创建的iceberg table 报错吗? 报错信息:Exception in thread "main" org.apache.spark.sql.AnalysisException: Cannot write nullable values to non-null column 'uid'

文章 2023-08-31 来自:开发者社区

一口气说完MR、Storm、Spark、SparkStreaming和Flink

这是彭文华的第92篇原创一直想写一篇大数据计算引擎的综述,但是这个话题有点大。今天试试看能不能一口气写完。没想到一口气从7点写到了凌晨2点大数据计算的起点是Hadoop的MapReduce。之前虽然有一些分布式计算的工具,但是公认的大数据计算引擎的始祖仍然是MapReduce,虽然现在已经逐渐被同是批处理的Spark替代了。如同MapReduce一样,Storm开启了流式数据处理的先河,现在也被....

一口气说完MR、Storm、Spark、SparkStreaming和Flink
文章 2023-08-24 来自:开发者社区

Apache Celeborn 让 Spark 和 Flink 更快更稳更弹性

摘要:本文整理自阿里云/数据湖 Spark 引擎负责人周克勇(一锤)在 Streaming Lakehouse Meetup 的分享。内容主要分为五个部分: Apache Celeborn 的背景Apache Celeborn——快Apache Celeborn——稳Apache Celeborn——弹Evaluation 点击查看原文视...

Apache Celeborn 让 Spark 和 Flink 更快更稳更弹性
文章 2023-08-22 来自:开发者社区

大数据技术解析:Hadoop、Spark、Flink和数据湖的对比

随着数字化时代的到来,数据已经成为企业和组织的重要资产之一。为了更好地处理、分析和挖掘海量数据,大数据技术逐渐崭露头角。在本文中,我们将深入探讨大数据处理领域中的一些关键技术,包括 Hadoop、Spark、Flink 和数据湖,分析它们的优势、劣势以及适用场景。 Hadoop Hadoop 是一个开源的分布式计算框架,旨在处理大规模数据。它的核心组件包括分布式文件系统 HDFS 和 M...

大数据技术解析:Hadoop、Spark、Flink和数据湖的对比
问答 2023-06-29 来自:开发者社区

DataWorks实时计算只能用EMR Spark Streaming节点吗?有没有flink sq

DataWorks实时计算只能用EMR Spark Streaming节点吗?有没有flink sql

文章 2023-05-25 来自:开发者社区

「大数据分析」寻找数据优势:Spark和Flink终极对决

这是数据处理引擎的发电站,它们正竞相定义下一个大数据时代当涉及到大数据时,流计算和它所带来的实时强大分析的重要性是不可避免的。此外,当涉及到流计算时,无法避免该领域最强大的两种数据处理引擎:Spark和Flink。自2014年以来,Apache Spark的受欢迎程度迅速上升,在某些情况下,它的性能超过了Hadoop MapReduce的三位数,提供了一个统一的引擎,支持所有常见的数据处理场景,....

「大数据分析」寻找数据优势:Spark和Flink终极对决
问答 2023-02-14 来自:开发者社区

基于yarn,spark任务可以配置动态资源内存和核数,flink呢?

基于yarn,spark任务可以配置动态资源内存和核数,flink呢,是任务一开始配置多大内存就是多大吗?flink不用配置核数,一个任务会使用多少核呢?

问答 2023-02-09 来自:开发者社区

目前大数据行业除了做自有的产品外,hive,spark,flink等除了sql外,正常的业务会写代码

目前大数据行业除了做自有的产品外,hive,spark,flink等除了sql外,正常的业务会写代码?会有哪些业务或者企业会用到呢?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注