开箱即用
开箱即用,无缝迁移,帮助您的业务快速上云
高可用性
阿里巴巴消息产品研发与性能优化团队,进一步优化开源产品长期以来的痛点,提供更优质的服务
全托管服务
专业的且经验丰富的运维团队,提供体系化的产品运维
开箱即用
开箱即用,无缝迁移,帮助您的业务快速上云
高可用性
阿里巴巴消息产品研发与性能优化团队,进一步优化开源产品长期以来的痛点,提供更优质的服务
全托管服务
专业的且经验丰富的运维团队,提供体系化的产品运维
构建日志分析平台
网站活动跟踪
流计算处理
数据中转枢纽
淘宝、天猫平台等公司每天都会产生大量的日志。Kafka 性能高效,同时 Kafka 的特性决定它非常适合作为"日志收集中心": 1. 采集日志时业务无感知;2. Hadoop/ODPS 等离线仓库存储和 Storm/Spark 等实时在线分析对接;
构建应用系统和分析系统的桥梁,并将它们之间的关联解耦;
支持实时在线分析系统和类似于Hadoop之类的离线分析系统;
通过消息队列 Kafka 版可以实时收集网站活动数据(包括用户浏览页面、搜索及其他行为等)。发布-订阅的模式可以根据不同的业务数据类型,将消息发布到不同的 Topic;还可通过订阅消息的实时投递,将消息流用于实时监控与业务分析或加载到 Hadoop、ODPS 等离线数据仓库系统进行离线处理;
网站所有用户产生的行为信息极为庞大,需要非常高的吞吐量来支持;
可对接 Storm/Spark 实时流计算引擎,亦可对接 Hadoop/ODPS 等离线数据仓库系统;
股市走向分析、气象数据测控、网站用户行为分析等领域,由于数据产生快、实时性强、数据量大,所以很难统一采集并入库存储后再做处理,这便导致传统的数据处理架构不能满足需求。而Kafka 以及 Storm/Samza/Spark 等流计算引擎的出现,可以根据业务需求对数据进行计算分析,最终把结果保存或者分发给需要的组件。
由于数据产生非常快且数据量大,需要非常高的可扩展性;
可对接开源 Storm/Samza/Spark 以及 EMR、Blink、StreamCompute 等阿里云产品;
近年来KV存储(HBase)、搜索(ElasticSearch)、流式处理(Storm/Spark Streaming/Samza)、时序数据库(OpenTSDB)等等专用系统应运而生,产生了同一份数据集需要被注入到多个专用系统内的需求。利用Kafka 作为数据中转枢纽,同份数据可以被导入到不同专用系统中。
发布/订阅模型,支持同份数据集能同时被消费多次;
本地数据持久以及PageCache,在无性能损耗的情况下能同时传送消息到实时和批处理消费者;