文章 2022-04-27 来自:开发者社区

最强最全面的大数据SQL经典面试题(由31位大佬共同协作完成)(四)

十七、时间序列--构造累积日期表名:t17表字段及内容:date_id 2017-08-01 2017-08-02 2017-08-03问题一:每一日期,都扩展成月初至当天输出结果如下所示:date_id date_to_day 2017-08-01 2017-08-01 2017-08-02 2017-08-01 2017-08-02 2017-08-02 2017-08-0...

文章 2022-04-27 来自:开发者社区

最强最全面的大数据SQL经典面试题(由31位大佬共同协作完成)(三)

十、容器--反转内容表名:t10表字段及内容:a AB,CA,BAD BD,EA问题一:反转逗号分隔的数据:改变顺序,内容不变输出结果如下所示:BAD,CA,AB EA,BD参考答案:select a, concat_ws(",",collect_list(reverse(str))) from ( select a, str from t10 late...

文章 2022-04-27 来自:开发者社区

最强最全面的大数据SQL经典面试题(由31位大佬共同协作完成)(二)

五、产生连续数值输出结果如下所示:1 2 3 4 5 ... 100参考答案:不借助其他任何外表,实现产生连续数值此处给出两种解法,其一:select id_start+pos as id from( select 1 as id_start, 1000000 as id_end ) m lateral view posexplode(split(space(id_en...

文章 2022-04-27 来自:开发者社区

最强最全面的大数据SQL经典面试题(由31位大佬共同协作完成)(一)

本套SQL题的答案是由许多小伙伴共同贡献的,1+1的力量是远远大于2的,有不少题目都采用了非常巧妙的解法,也有不少题目有多种解法。本套大数据SQL题不仅题目丰富多样,答案更是精彩绝伦!注:以下参考答案都经过简单数据场景进行测试通过,但并未测试其他复杂情况。本文档的SQL主要使用Hive SQL。一、行列转换描述:表中记录了各年份各部门的平均绩效考核成绩。表名:t1表结构:a -- 年份 b --....

文章 2022-04-27 来自:开发者社区

大数据面试吹牛草稿V2.0 (三)

七、实时指标每日日活实时统计每日订单量实时统计一小时内日活实时统计一小时内订单数实时统计一小时内交易额实时统计一小时内广告点击实时统计一小时内区域订单数统计一小时内区域订单额统计一小时内各品类销售 top3 商品统计用户购买明细灵活分析(根据区域,性别,品类等)八、写出分析最难的两个指标面试官说现场手写你分析过最难的两个指标:最好不要选择最难的,除非你能完全写出来,并且还得让面试官理解你做的指标....

文章 2022-04-27 来自:开发者社区

大数据面试吹牛草稿V2.0 (二)

在 Lambda 架构中,每层都有自己所肩负的任务。1. 批处理层存储管理主数据集(不可变的数据集)和预先批处理计算好的视图:批处理层使用可处理大量数据的分布式处理系统预先计算结果。它通过处理所有的已有历史数据来实现数据的准确性。这意味着它是基于完整的数据集来重新计算的,能够修复任何错误,然后更新现有的数据视图。输出通常存储在只读数据库中,更新则完全取代现有的预先计算好的视图。2. 流处理层会实....

大数据面试吹牛草稿V2.0 (二)
文章 2022-04-27 来自:开发者社区

大数据面试吹牛草稿V2.0 (一)

面试吹牛之前先打个草稿!各位面试官好!1.我叫 xxx,毕业于 xxx,之前在 xxx 公司待了 1 年多,期间⼀直从事的是 IT 行业,刚开始的时候做的是 Java 开发后来转岗到大数据方向做大数据开发; 刚转行到大数据开发的时候开始比较困难的,大数据并不像 Java 那样⼀套框架基本可以搞定所有的问题,而是不同的业务对于同⼀个问题有多种解决方案。2.我叫 xxx,毕业至今就职于 xx 公司,....

大数据面试吹牛草稿V2.0 (一)
文章 2022-04-27 来自:开发者社区

字节跳动大数据开发面试题-附答案 (二)

下面就分几个方面介绍两个框架的主要区别:架构模型:Spark Streaming 在运行时的主要角色包括:Master、Worker、Driver、Executor;Flink 在运行时主要包:Jobmanager、Taskmanager 和 Slot。任务调度:Spark Streaming 连续不断的生成微小的数据批次,构建有向无环图 DAG, Spark Streaming 会依次创 DS....

字节跳动大数据开发面试题-附答案 (二)
文章 2022-04-27 来自:开发者社区

字节跳动大数据开发面试题-附答案 (一)

此面试题来自牛客网友分享的字节跳动应届一面,面试时长一小时。 网友情况:985 本硕。 以下为面试过程中提问,岗位为大数据开发:自我介绍+项目介绍为什么用 kafka、sparkstreaming、hbase?有什么替代方案吗?聊聊你觉得大数据的整个体系?你看过 hdfs 源码?nn 的高可用说一下zookeeper 简单介绍一下,为什么要用 zk?zk 的架构?zab?hbase 的架构,读写....

字节跳动大数据开发面试题-附答案 (一)
文章 2022-04-27 来自:开发者社区

2021超全大数据面试宝典,吐血总结十万字,大数据面试收藏这一篇就够了 (五)

MySql中表的分类实体表,维度表,事务型事实表,周期性事实表其实最终可以把事务型事实表,周期性事实表统称实体表,实体表,维度表统称维度表 订单表(order_info)(周期型事实表)订单详情表(order_detail)(事务型事实表)商品表(实体表)用户表(实体表)商品一级分类表(维度表)商品二级分类表(维度表)商品三级分类表(维度表)支付流水表(事务型实体表)同步策略 ...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Java面试那些事儿

手把手带您学习Java,开启编程之路。

+关注