文章 2023-12-20 来自:开发者社区

【大数据技术Hadoop+Spark】HDFS Shell常用命令及HDFS Java API详解及实战(超详细 附源码)

需要源码请点赞关注收藏后评论区留言私信~~~一、HDFS的Shell介绍Shell在计算机科学中俗称“壳”,是提供给使用者使用界面的进行与系统交互的软件,通过接收用户输入的命令执行相应的操作,Shell分为图形界面Shell和命令行式Shell。文件系统(FS)Shell包含了各种的类Shell的命令,可以直接与Hadoop分布式文件系统以及其他文件系统进行交互。常用命令如下 二、案例-Shel....

【大数据技术Hadoop+Spark】HDFS Shell常用命令及HDFS Java API详解及实战(超详细 附源码)
文章 2023-12-12 来自:开发者社区

大数据Spark企业级实战与Hadoop实战&PDF和PPT

今天给大家分享的是《大数据Spark企业级实战》与《Hadoop实战》《大数据处理系统·Hadoop源代码情景分析》《50个大厂大数据算法教程》等销量排行前10名的大数据技术书籍(文末领取PDF版)。这些书籍具有以下几个优点:易读、实践性强,对解决工作中遇到的业务问题具有一定启发性。本书完全从企业处理大数据业务场景的角度出发,完全基于实战代码来组织内容,从零起步,完全无痛地掌握Spark大数据处....

大数据Spark企业级实战与Hadoop实战&PDF和PPT
文章 2023-08-16 来自:开发者社区

大数据Spark企业级实战与Hadoop实战&PDF和PPT

今天给大家分享的是《大数据Spark企业级实战》与《Hadoop实战》《大数据处理系统·Hadoop源代码情景分析》《50个大厂大数据算法教程》等销量排行前10名的大数据技术书籍(文末领取PDF版)。这些书籍具有以下几个优点:易读、实践性强,对解决工作中遇到的业务问题具有一定启发性。本书完全从企业处理大数据业务场景的角度出发,完全基于实战代码来组织内容,从零起步,完全无痛地掌握Spark大数据处....

大数据Spark企业级实战与Hadoop实战&PDF和PPT
文章 2023-08-15 来自:开发者社区

【大数据】Apache Spark入门到实战 4

创建 DataFrame在 Scala 中,可以通过以下几种方式创建 DataFrame:从现有的 RDD 转换而来。例如:import org.apache.spark.sql.SparkSession val spark = SparkSession.builder.appName("Create DataFrame").getOrCreate() import spark.implicit....

文章 2023-08-15 来自:开发者社区

【大数据】Apache Spark入门到实战 3

CheckPointCheckPoint可以将RDD从其依赖关系中抽出来,保存到可靠的存储系统(例如HDFS,S3等), 即它可以将数据和元数据保存到检查指向目录中。因此,在程序发生崩溃的时候,Spark可以恢复此数据,并从停止的任何地方开始。CheckPoint分为两类:高可用CheckPoint:容错性优先。这种类型的检查点可确保数据永久存储,如存储在HDFS或其他分布式文件系统上。这也意味....

文章 2023-08-15 来自:开发者社区

【大数据】Apache Spark入门到实战 2

RDDRDD的概念在Spark中十分重要,上面只是简单的介绍了一下,下面详细的对RDD展开介绍。RDD是“Resilient Distributed Dataset”的缩写,从全称就可以了解到RDD的一些典型特性:Resilient(弹性):RDD之间会形成有向无环图(DAG),如果RDD丢失了或者失效了,可以从父RDD重新计算得到。即容错性。Distributed(分布式):RDD的数据是以逻....

文章 2023-08-15 来自:开发者社区

【大数据】Apache Spark入门到实战 1

之前说到了之后工作中会接触到Spark离线任务相关的内容,也预先学习了Scala,所以这篇文章它来了。本篇文章会介绍Spark的相关概念以及原理,帮助初学者快速入门Spark。Spark是什么学习一个东西之前总要知道这个东西是什么。Spark 是一个开源的大数据处理引擎,它提供了一整套开发 API,包括流计算和机器学习。它支持批处理和流处理。Spark 的一个显著特点是它能够在内存中进行迭代计算....

【大数据】Apache Spark入门到实战 1

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注