文章 2019-04-01 来自:开发者社区

基于HBase和Spark构建企业级数据处理平台

$stringUtil.substring( $!{XssContent1.description},200)...

文章 2017-02-14 来自:开发者社区

【Spark Summit EU 2016】快速数据处理最佳拍档:Spark+ Ignite

$stringUtil.substring( $!{XssContent1.description},200)...

文章 2017-02-13 来自:开发者社区

【Spark Summit EU 2016】在在线学习中使用Structured Streaming流数据处理引擎

$stringUtil.substring( $!{XssContent1.description},200)...

文章 2016-11-25 来自:开发者社区

Spark Shuffle数据处理过程与部分调优(源码阅读七)

$stringUtil.substring( $!{XssContent1.description},200)...

文章 2016-06-15 来自:开发者社区

地铁译:Spark for python developers ---Spark流式数据处理

先研究一下不断改变的动态环境带来的挑战,在列出流处理应用的先决条件(如,Twitter的TCP Sockets连接)之后, 结合Spark, Kafka 和 Flume 把数据放入一个低延迟,高吞吐量,可缩放的处理流水线。
 要点如下: 
• 分析流式应用架构的挑战,约束和需求
 
• 利用Spark Streaming 从 TCP socket 中处理实时数据 

• 连接 ...

文章 2016-02-17 来自:开发者社区

数据处理平台架构中的SMACK组合:Spark、Mesos、Akka、Cassandra以及Kafka

在今天的文章中,我们将着重探讨如何利用SMACK(即Spark、Mesos、Akka、Cassandra以及Kafka)堆栈构建可扩展数据处理平台。虽然这套堆栈仅由数个简单部分组成,但其能够实现大量不同系统设计。除了纯粹的批量或者流处理机制之外,我们亦可借此实现复杂的Lambda以及Kappa架构。 在本文开始阐述之前,让我们首先立足于已有生产项目经验从设计与示例入手进行说明。 综述 • ...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注