文章 2020-03-08 来自:开发者社区

【译】Databricks使用Spark Streaming和Delta Lake对流式数据进行数据质量监控介绍

原文链接:https://databricks.com/blog/2020/03/04/how-to-monitor-data-stream-quality-using-spark-streaming-and-delta-lake.html 在这个一切都需要进行加速的时代,流数据的使用变得越来越普遍。我们经常不再听到客户问:“我可以流式传输这些数据吗?”,更多的是问:“我们能以多快的速度流式传输....

【译】Databricks使用Spark Streaming和Delta Lake对流式数据进行数据质量监控介绍
文章 2020-02-20 来自:开发者社区

从 Spark Streaming 到 Apache Flink:bilibili 实时平台的架构与实践

摘要:本文由 bilibili 大数据实时平台负责人郑志升分享,基于对 bilibili 实时计算的痛点分析,详细介绍了 bilibili Saber 实时计算平台架构与实践。本次分享主要围绕以下四个方面: 一、实时计算的痛点 二、Saber 的平台演进 三、结合 AI 的案例实践 四、未来的发展与思考 重要:点击「PPT」可下载 Flink Forward Asia 大会全部PP...

文章 2019-12-27 来自:开发者社区

通过Spark Streaming作业处理Kafka数据

本节介绍如何使用阿里云E-MapReduce部署Hadoop集群和Kafka集群,并运行Spark Streaming作业消费Kafka数据。 前提条件 已注册阿里云账号,详情请参见注册云账号。 已开通E-MapReduce服务。 已完成云账号的授权,详情请参见角色授权。 背景信息 在开发过程中,通常会遇到消费Kafka数据的场景。在阿里云E-MapReduce中,您可通过运行Spark S...

通过Spark Streaming作业处理Kafka数据
问答 2019-12-20 来自:开发者社区

spark streaming实时程序 进程总是运行三四个小时左右不知道原因挂掉

我用spark stream每两分钟从kafka拉取数据,用的是standalone模式,但是程序总是运行三四个小时左右就会挂掉,查了很久不知道什么原因。 提交程序的节点work目录下的stderr文件最后的打印是这样的: 我看进程死掉前的内存情况也挺健康的,截图如下:

文章 2019-11-27 来自:开发者社区

使用阿里云InfluxDB®和Spark Streaming实时处理时序数据

本文重点介绍怎样利用阿里云InfluxDB®和spark structured streaming来实时计算、存储和可视化数据。下面将介绍如何购买和初始化阿里云InfluxDB®,扩展spark foreach writer,以及设计阿里云InfluxDB®数据库时需要注意的事项。在大数据处理中,一个主要的趋势是人们希望看到metric是如何随着时间变化发展。这使得管理和处理时序数据(数值随时间....

问答 2019-11-20 来自:开发者社区

Flink相比Spark Streaming有什么区别?

Flink相比Spark Streaming有什么区别?

问答 2019-10-29 来自:开发者社区

Spark Streaming 和kafka整合后读取消息报错

Spark Streaming 和kafka整合后读取消息报错: OffsetOutOfRangeException

问答 2019-10-29 来自:开发者社区

Spark Streaming和Storm有何区别?

Spark Streaming和Storm有何区别?

问答 2019-10-24 来自:开发者社区

spark streaming 程序中存在多个foreachRDD操作存到mysql?

针对单个foreachRDD操作可以mysql的事务处理,多个的情况怎么做呀?有遇到这个问题吗? 本问题来自阿里云开发者社区的【11大垂直技术领域开发者社群】。点击链接欢迎加入感兴趣的技术领域群

文章 2019-10-16 来自:开发者社区

使用Spark Streaming SQL进行PV/UV统计

作者:关文选,花名云魄,阿里云E-MapReduce 高级开发工程师,专注于流式计算,Spark Contributor 1.背景介绍 PV/UV统计是流式分析一个常见的场景。通过PV可以对访问的网站做流量或热点分析,例如广告主可以通过PV值预估投放广告网页所带来的流量以及广告收入。另外一些场景需要对访问的用户作分析,比如分析用户的网页点击行为,此时就需要对UV做统计。使用Spark Stre.....

使用Spark Streaming SQL进行PV/UV统计

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注