文章 2022-02-15 来自:开发者社区

SparkSQL(Spark-1.4.0)实战系列(三)——SparkSQL应用案例

本节主要内容 数据准备 案例实战 数据准备 将实验数据Date.txt、Stock.txt、StockDetail.txt(hadoop fs -put /data /data)上传到HDFS上,如下图所示 Date.txt格式如下: //Date.txt文件定义了日期的分类,将每天分别赋予所属的月份、星期、季度等属性 //日期,年月,年,月,日,周几,第几周,季度,旬、半...

SparkSQL(Spark-1.4.0)实战系列(三)——SparkSQL应用案例
文章 2022-02-15 来自:开发者社区

SparkSQL(Spark-1.4.0)实战系列(二)——DataFrames进阶

本节主要内容如下 DataFrame与RDD的互操作实战 不同数据源构建DataFrame实战 DataFrame与RDD的互操作实战 1 采用反映机制进行Schema类型推导(RDD到DataFrame的转换) SparkSQL支持RDD到DataFrame的自动转换,实现方法是通过Case类定义表的Schema,Spark会通过反射机制读取case class的参数名并将其配置成表...

SparkSQL(Spark-1.4.0)实战系列(二)——DataFrames进阶
文章 2022-02-15 来自:开发者社区

SparkSQL(Spark-1.4.0)实战系列(一)——DataFrames基础

主要内容 本教程中所有例子跑在Spark-1.4.0集群上 DataFrames简介 DataFrame基本操作实战 DataFrames简介 本文部分内容译自https://databricks.com/blog/2015/02/17/introducing-dataframes-in-spark-for-large-scale-data-science.html DataFram...

SparkSQL(Spark-1.4.0)实战系列(一)——DataFrames基础

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注