文章 2024-01-22 来自:开发者社区

最新版本——Hadoop3.3.6单机版完全部署指南

大家好,我是独孤风,大数据流动的作者。本文基于最新的 Hadoop 3.3.6 的版本编写,带大家通过单机版充分了解 Apache Hadoop 的使用。本文更强调实践,实践是大数据学习的重要环节,也能在实践中对该技术有更深的理解,所以一些理论知识建议大家多阅读相关的书籍(都在资料包中)。本文档版权归大数据流动所有,请勿商用,全套大数据、数据治理、人工智能相关学习资料,请关注大数据流动。(本文所....

最新版本——Hadoop3.3.6单机版完全部署指南
文章 2023-12-23 来自:开发者社区

Hadoop【部署 02】hadoop-3.1.3 单机版YARN(配置、启动停止shell脚本修改及服务验证)

1. 修改配置进入 ${HADOOP_HOME}/etc/hadoop/ 目录下,修改以下配置:mapred-site.xml[root@tcloud ~]# vim /usr/local/hadoop-3.1.3/etc/hadoop/mapred-site.xml<configuration> <property> <name>mapreduce....

Hadoop【部署 02】hadoop-3.1.3 单机版YARN(配置、启动停止shell脚本修改及服务验证)
文章 2023-12-23 来自:开发者社区

Hadoop【部署 01】腾讯云Linux环境CentOS Linux release 7.5.1804单机版hadoop-3.1.3详细安装步骤(安装+配置+初始化+启动脚本+验证)

我使用的安装文件是 hadoop-3.1.3.tar.gz ,以下内容均以此版本进行说明。1.前置条件Hadoop 的运行依赖 jdk 我安装的 openjdk11【这里有个很深的坑,随后会说明】。[root@tcloud ~]# java -version openjdk version "11" 2018-09-25 OpenJDK Runtime Environment 18.9 (bui....

Hadoop【部署 01】腾讯云Linux环境CentOS Linux release 7.5.1804单机版hadoop-3.1.3详细安装步骤(安装+配置+初始化+启动脚本+验证)
文章 2023-12-22 来自:开发者社区

大数据成长之路-- hadoop集群的部署(4)退役旧数据节点

退役旧数据节点目标:掌握HDFS在集群中删除掉无效节点的步骤第一步:创建dfs.hosts.exclude配置文件在namenod的cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop目录下创建dfs.hosts.exclude文件,并添加需要退役的主机名称node01执行以下命令cd /export/servers/hadoop-2.6.0-....

大数据成长之路-- hadoop集群的部署(4)退役旧数据节点
文章 2023-12-22 来自:开发者社区

大数据成长之路-- hadoop集群的部署(3)HDFS新增节点

大数据成长之路-- hadoop集群的部署(3)6、HDFS新增节点服役新数据节点目标:掌握HDFS新添加节点到集群的步骤需求基础:随着公司业务的增长,数据量越来越大,原有的数据节点的容量已经不能满足存储数据的需求,需要在原有集群基础上动态添加新的数据节点。 准备新节点第一步:复制一台新的虚拟机出来将我们纯净的虚拟机复制一台出来,作为我们新的节点 第二步:修改mac地址以及IP地址修改ma...

文章 2023-12-22 来自:开发者社区

大数据成长之路------hadoop集群的部署(2)Hadoop集群安装部署

hadoop集群的部署Hadoop集群安装部署1、服务器主机名和IP配置(三台) 2、修改每个主机的/etc/hosts文件,添加IP和主机名的对应关系(三台) 3、管理节点到从节点配置无密码登录 4、配置jdk 1.8(三台) 5、关闭防火墙(三台) 6、关闭selinux(三台) vi /etc/selinux/config SELINUX=enforcing SELIN...

大数据成长之路------hadoop集群的部署(2)Hadoop集群安装部署
文章 2023-12-22 来自:开发者社区

大数据成长之路------hadoop集群的部署 配置系统网络(静态) 新增集群(三台)

hadoop集群的部署配置系统网络(静态)配置系统网络(静态)第一步 查看虚拟机唯一标识(MAC地址)查看虚拟机设置00:0C:29:95:6F:C4MAC地址需要详细记录(很关键)第二步 调整70-persistent-net.rules文件删除掉红色框内的内容将eth1 改为eth0(当前网卡编号)address 必须与前面的唯一标识相同,若不相同,需要将address改为和MAC相同保存退....

大数据成长之路------hadoop集群的部署 配置系统网络(静态) 新增集群(三台)
文章 2023-12-05 来自:开发者社区

Hadoop学习笔记(HDP)-Part.08 部署Ambari集群

目录Part.01 关于HDPPart.02 核心组件原理Part.03 资源规划Part.04 基础环境配置Part.05 Yum源配置Part.06 安装OracleJDKPart.07 安装MySQLPart.08 部署Ambari集群Part.09 安装OpenLDAPPart.10 创建集群Part.11 安装KerberosPart.12 安装HDFSPart.13 安装Ranger....

Hadoop学习笔记(HDP)-Part.08 部署Ambari集群
文章 2023-11-13 来自:开发者社区

:大数据行业部署实战3:基于Hadoop的Web版的云盘

一、实验目的熟练采用JAVA API访问 HDFS。二、实验原理HDFS是hadoop平台的核心组成之一。熟悉使用hadoop平台需要熟练访问HDFS。HDFS的访问方式有多种。可通过web访问,也可通过shell方式或者API方式访问。基本操作有对文件的读、写、追加、删除等。新建文件夹、删除文件夹等。还可显示文件及文件夹的属性。HDFS主要用到了FileSystem类,相关的接口可以在这里查到....

:大数据行业部署实战3:基于Hadoop的Web版的云盘
文章 2023-11-13 来自:开发者社区

大数据行业部署实战1:Hadoop伪分布式部署

一、Hadoop 介绍Apache Hadoop 软件库是一个框架,允许在集群服务器上使用简单的编程模型对大数据集进行分布式处理。Hadoop 被设计成能够从单台服务器扩展到数以千计的服务器,每台服务器都有本地的计算和存储资源。Hadoop 的高可用性并不依赖硬件,其代码库自身就能在应用层侦测并处理硬件故障,因此能基于服务器集群提供高可用性的服务。1. Hadoop 生态系统主要包含以下几部分:....

大数据行业部署实战1:Hadoop伪分布式部署

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

大数据

大数据计算实践乐园,近距离学习前沿技术

+关注