文章 2024-10-14 来自:开发者社区

大数据-149 Apache Druid 基本介绍 技术特点 应用场景

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完) HDFS(已更完) MapReduce(已更完) Hive(已更完) Flume(已更完) Sqoop(已更完) Zookeeper(已更完) HBase(已更完) Redis (已更完) Kafka(已更完) ...

大数据-149 Apache Druid 基本介绍 技术特点 应用场景
文章 2024-09-19 来自:开发者社区

Apache Flink 流批融合技术介绍

摘要:本文整理自阿里云高级研发工程师、Apache Flink Contributor 周云峰老师在 Apache Asia CommunityOverCode 2024中的分享。内容主要分为以下三个部分: 从流批一体到流批融合流批融合的技术解决方案社区进展及未来展望 一、从流批一体到流批融合 1.流批一体 在流批融合之前,Flink...

Apache Flink 流批融合技术介绍
文章 2024-09-14 来自:开发者社区

Apache Spark Streaming技术深度解析

1. 简介 Apache Spark Streaming是Apache Spark生态系统中用于处理实时数据流的一个重要组件。它将输入数据分成小批次(micro-batch),然后利用Spark的批处理引擎进行处理,从而结合了批处理和流处理的优点。这种处理方式使得Spark Streaming既能够保持高吞吐量,又能够处理实时数据流。 2. 主要特点 实时数据...

文章 2024-06-26 来自:开发者社区

深入理解Apache Commons Pool2池化技术

1️⃣Apache Commons Pool2简介 Apache Commons Pool2是Apache Commons下的一个开源项目,主要用于实现和管理对象池。对象池是一种常见的设计模式,通过复用来分摊昂贵对象的创建和销毁代价,从而优化资源利用和提高应用程序性能。 Commons Pool2提供了一套用于实现对象池化的API,并内置了多种各具特色的对象池实现。其被...

深入理解Apache Commons Pool2池化技术
文章 2024-06-26 来自:开发者社区

Apache POI与easyExcel:Excel文件导入导出的技术深度分析

一、Apache POI:全面但重量级的解决方案 Apache POI是一个历史悠久且功能全面的开源项目,用于处理Microsoft Office格式文件,包括Excel。它提供了对Excel文件读写操作的全面支持,在处理Excel文件时,POI通过HSSF和XSSF两个子项目分别支持.xls和.xlsx格式。HSSF针对的是旧版的二进制Excel格式,而XSSF则是为新版的基于XML的...

Apache POI与easyExcel:Excel文件导入导出的技术深度分析
文章 2024-06-07 来自:开发者社区

使用Apache HBase进行大数据存储:技术解析与实践

一、引言 在大数据领域,数据存储和查询是两大核心挑战。传统的关系型数据库在处理海量数据时往往显得力不从心,因此,NoSQL数据库应运而生。Apache HBase作为NoSQL数据库家族的一员,以其列式存储、可扩展、高性能等特性,在大数据存储领域占据了重要位置。本文将详细介绍HBase的技术原理、使用场景、以及如何在实际项目中...

文章 2024-06-06 来自:开发者社区

使用Apache Solr进行搜索优化的技术探索

一、引言 在数据驱动的时代,信息的快速检索和准确呈现对于企业和用户都至关重要。Apache Solr,作为一款基于Lucene构建的开源搜索平台,提供了高性能、可扩展的搜索功能。本文将介绍如何使用Apache Solr进行搜索优化,以提高搜索效率和准确性。 二、Apache Solr概述 Apache Solr是一个基于Java的开源搜索平...

文章 2024-06-05 来自:开发者社区

使用Apache Airflow进行工作流编排:技术详解与实践

引言: 在现代数据处理和分析的领域中,工作流编排工具扮演着至关重要的角色。随着数据管道的复杂性不断增加,如何有效地管理和调度这些数据处理任务成为了一个挑战。Apache Airflow,作为一个强大的工作流编排平台,提供了一个简单而灵活的方式来定义、调度和监控数据工作流。本文将详细介绍Apache Airflow的基本概念、特...

文章 2024-06-05 来自:开发者社区

使用Apache Cassandra进行分布式数据库管理的技术实践

引言: 在数字化时代,数据的规模和复杂性持续增长,传统的关系型数据库已经无法满足现代应用的需求。特别是在处理大规模、高并发、高可用性的数据场景时,分布式数据库成为了不可或缺的解决方案。Apache Cassandra作为一款高性能、可扩展的分布式数据库,已经在许多大型系统中得到了广泛的应用。本文将介绍如何使用Apache Ca...

文章 2024-06-04 来自:开发者社区

使用Apache Hadoop进行分布式计算的技术详解

一、引言 随着数据量的爆炸性增长,传统的单机计算模式已经无法满足大规模数据处理的需求。在这样的背景下,分布式计算框架如Apache Hadoop应运而生,它以其高可靠性、高扩展性、高效性和易用性,成为大数据处理领域的佼佼者。本文将详细介绍Apache Hadoop的基本概念、架构和工作原理,并通过实例说明如何使用Hadoop进...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注
相关镜像