问答 2022-02-15 来自:开发者社区

MaxCompute SQL优化与大数据开发是根据倾斜发生的阶段可分几种呢?

MaxCompute SQL优化与大数据开发是根据倾斜发生的阶段可分几种呢?

问答 2022-02-15 来自:开发者社区

MaxCompute SQL优化与大数据开发选用小表原则是什么呢?

MaxCompute SQL优化与大数据开发选用小表原则是什么呢?

问答 2022-02-15 来自:开发者社区

MaxCompute SQL优化与大数据开发选表原则是什么呢?

MaxCompute SQL优化与大数据开发选表原则是什么呢?

文章 2022-01-06 来自:开发者社区

大数据进阶之路——Spark SQL小结

手写 WordCount使用flatMap、reduceByKey 来计算//sc是SparkContext对象,该对象是提交spark程序的入口 sc.textFile("file:///home/hadoop/data/hello.txt") // 读取文件, .flatMap(line => line.split(" ")) // 将文件中的每一行单词按照分隔符(这里是空格)分...

大数据进阶之路——Spark SQL小结
文章 2022-01-06 来自:开发者社区

大数据进阶之路——Spark SQL补充

手写 WordCount使用flatMap、reduceByKey 来计算//sc是SparkContext对象,该对象是提交spark程序的入口 sc.textFile("file:///home/hadoop/data/hello.txt") // 读取文件, .flatMap(line => line.split(" ")) // 将文件中的每一行单词按照分隔符(这里是空格)分...

大数据进阶之路——Spark SQL补充
文章 2022-01-06 来自:开发者社区

大数据进阶之路——Spark SQL日志分析

基本方案用户行为日志:用户每次访问网站时所有的行为数据(访问、浏览、搜索、点击…)用户行为轨迹、流量日志日志数据内容:1)访问的系统属性: 操作系统、浏览器等等2)访问特征:点击的url、从哪个url跳转过来的(referer)、页面上的停留时间等3)访问信息:session_id、访问ip(访问城市)等2013-05-19 13:00:00 http://www.taobao.com/...

大数据进阶之路——Spark SQL日志分析
文章 2022-01-06 来自:开发者社区

大数据进阶之路——Spark SQL 之 DataFrame&&Dataset

DataFrame它不是Spark SQL提出的,而是早起在R、Pandas语言就已经有了的。A Dataset is a distributed collection of data:分布式的数据集A DataFrame is a Dataset organized into named columns.以列(列名、列的类型、列值)的形式构成的分布式数据集,按照列赋予不同的名称datafram....

大数据进阶之路——Spark SQL 之 DataFrame&&Dataset
文章 2021-12-31 来自:开发者社区

大数据进阶之路——Spark SQL基本配置

文章目录Spark安装编译失败环境搭建Standalone本地IDEHiveContextAPPSparkSessinonSpark ShellSpark Sqlthriftserver/beeline的使用jdbcMapReduce的局限性:1)代码繁琐;2)只能够支持map和reduce方法;3)执行效率低下;4)不适合迭代多次、交互式、流式的处理;框架多样化:1)批处理(离线):MapRe....

大数据进阶之路——Spark SQL基本配置
文章 2021-12-31 来自:开发者社区

大数据进阶之路——Spark SQL环境搭建

@[toc]大数据概述定义和特征海量的计算大量的用户全体数据分析数据管理4V特征1.Volume(大量)  截至目前,人类生产的所有印刷材料的数据量是200PB,而历史上全人类总共说过的话的数据量大约是5EB。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。2.Velocity(高速)  这是大数据区分于传统数据挖掘的最显著特征。根据IDC的“数字宇宙”的报告,预....

大数据进阶之路——Spark SQL环境搭建
问答 2021-12-11 来自:开发者社区

MaxCompute SQL优化与大数据开发时对于倾斜现象有几种解决方式呢?

MaxCompute SQL优化与大数据开发时对于倾斜现象有几种解决方式呢?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

数据库

分享数据库前沿,解构实战干货,推动数据库技术变革

+关注