阿里云文档 2025-05-07

HBase在线迁移数据

本方案通过结合HBase Snapshot和HBase Replication技术,在源端HBase集群不停服的情况下,实现存量数据和增量数据的在线迁移,确保迁移过程中数据无丢失。

阿里云文档 2025-04-16

读写HBase

基于HBase官方提供的Spark Connector,EMR Serverless Spark可以在开发时添加对应的配置来连接HBase。本文为您介绍在EMR Serverless Spark环境中实现HBase的数据读取和写入操作。

阿里云文档 2025-03-21

DataWorks的HBase数据同步的能力支持情况

HBase数据源为您提供读取和写入HBase的双向通道,本文为您介绍DataWorks的HBase数据同步的能力支持情况。

文章 2024-06-12 来自:开发者社区

【大数据】HDFS、HBase操作教程(含指令和JAVA API)

1.前言 本文是作者大数据专栏系列的其中一篇,前文中已经详细聊过分布式文件系统HDFS和分布式数据库HBase了,本文将会是它们的实操讲解。 2.HDFS 2.1.指令操作 创建目录: hdfs dfs -mkdir /user/mydir 递归创建目录: hdfs dfs -mkdir -p /user/...

【大数据】HDFS、HBase操作教程(含指令和JAVA API)
阿里云文档 2024-01-03

配置HBase数据源网络连通_大数据开发治理平台 DataWorks(DataWorks)

在调用API时,为了防止资源组不能正常访问数据源,您需要确保资源组的网络连通性。本文为您介绍EMR HBase数据源和资源组在不同网络环境下配置网络连通性的方法。

阿里云文档 2023-12-22

HBase-HDFS

HBASE-HDFS服务本质上是基于HDFS的,其主要作用是存放HBase的WAL文件,确保HBase日志的持久化与高可靠性。

文章 2022-07-24 来自:开发者社区

BigData:大数据开发的简介、核心知识(linux基础+Java/Python编程语言+Hadoop{HDFS、HBase、Hive}+Docker)、经典场景应用之详细攻略

导读:最近几天,有很多很多的网友留言都在咨询——如何学习大数据开发,以及如何跟上大数据时代而不被抛弃。今天周末,博主花了一段时间,统一采用本文章,以Hadoop生态系统布局进行回答,欢迎网友留言提建议。首先,大数定理告诉我们,在试验不变的条件下,重复试验多次,随机事件的频率近似于它概率。“有规律的随机事件”在大量重复出现的条件下,往往呈现几乎必然的统计特性。其次,大数据的主要价值——辅助决策。利....

BigData:大数据开发的简介、核心知识(linux基础+Java/Python编程语言+Hadoop{HDFS、HBase、Hive}+Docker)、经典场景应用之详细攻略
文章 2022-02-17 来自:开发者社区

BigData:大数据开发的简介、核心知识(linux基础+Java/Python编程语言+Hadoop{HDFS、HBase、Hive}+Docker)、经典场景应用之详细攻略

大数据简介          大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。Gartner定义的大数据:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海....

文章 2022-02-17 来自:开发者社区

Cloudera-manager(CDH6.3.0)大数据平台搭建一指禅(impala,kudu,hdfs,hive,kafka,yarn,spark,hbase,hue)

Cloudera-manager(CDH6.3.0)大数据平台搭建一指禅指南(impala,kudu,hdfs,hive,kafka,yarn,spark,hbase,hue) CHD6,大量hadoop生态的重大更新升级,果断把现有系统升级到CHD6上。 准备: 192.168.88.31 master--》机器名修改为:manager 还是重复的master把 192.1...

文章 2022-02-17 来自:开发者社区

大数据平台解决方案,Hadoop + HDFS+Hive+Hbase大数据开发整体架构设计

波若大数据平台Hadoop + HDFS+Hive+Hbase大数据开发工具剖析: HDFS:分布式、高度容错性文件系统,能提供高吞吐量的数据访问,非常适合大规模数据集上的应用,大规模的波若大数据平台(BR-odp)用户部署上1000台的HDFS集群。数据规模高达50PB以上 HDFS和MR共同组成Hadoop分布式系统体系结构的核心。HDFS在集群上实现了分布式文件系统,MR在集群上实现了分布....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云原生多模数据库Lindorm

Lindorm是适用于任何规模、多种类型的云原生数据库服务,支持海量数据的低成本存储处理和弹性按需付费,兼容HBase、Solr、SQL、OpenTSDB等多种开源标准接口,是互联网、IoT、车联网、广告、社交、监控、游戏、风控等场景首选数据库,也是为阿里巴巴核心业务提供支撑的数据库之一。

+关注