文章 2022-02-17 来自:开发者社区

消息队列面试解析系列(七)- 数据压缩(下)

4 压缩分段选型大部分压缩算法区别主要是,对数据进行编码的算法,压缩的流程和压缩包的结构大致一样。而在压缩过程中,你最需要了解的就是如何选择合适的压缩分段。压缩时,给定的被压缩数据它必须有确定长度,或是有头有尾的,不能是个无限数据流,若要对流数据压缩,必须把流数据划分成多帧,一帧帧分段压缩。主要因为压缩算法在压缩前,一般都需对被压缩数据从头到尾扫描:确定如何对数据划分和编码。一般原则:重复次数多....

消息队列面试解析系列(七)- 数据压缩(下)
文章 2022-02-17 来自:开发者社区

消息队列面试解析系列(七)- 数据压缩(上)

1 数据压缩意义Kafka使用数据压缩,最高可提升约几十倍吞吐量。数据压缩不仅可节省存储空间,还可用于提升网络传输性能。这种使用压缩提升系统性能的方法,不仅在MQ使用,日常开发也可。比如传输大量数据或要在磁盘、数据库中存储较大数据,这些情况下,都可考虑使用数据压缩提升性能,还能节省网络带宽和存储空间。2 数据压缩适用场景    进程间通过网络传输数据是不是需要压缩?不压缩直接....

文章 2022-02-14 来自:开发者社区

面试官:请说下 Redis 是如何保证在宕机后数据不丢失的

持久化首先我们说下什么是持久化,持久化是将程序数据在持久状态和瞬时状态间转换的机制。通俗的讲,就是瞬时数据(比如内存中的数据,是不能永久保存的)持久化为持久数据(比如持久化至数据库中,能够长久保存)。另外我们使用的 Redis 之所以快就是因为数据都存储在内存当中,为了保证在服务器出现异常过后还能恢复数据,所以就有了 Redis 的持久化。RDB 和 AOF前面说了什么是持久化,现在说说 Red....

面试官:请说下 Redis 是如何保证在宕机后数据不丢失的
文章 2022-01-10 来自:开发者社区

数据库面试题【十五、优化查询过程中的数据访问】

访问数据太多导致查询性能下降确定应用程序是否在检索大量超过需要的数据,可能是太多行或列确认MySQL服务器是否在分析大量不必要的数据行避免犯如下SQL语句错误查询不需要的数据。解决办法:使用limit解决多表关联返回全部列。解决办法:指定列名总是返回全部列。解决办法:避免使用SELECT *重复查询相同的数据。解决办法:可以缓存数据,下次直接读取缓存是否在扫描额外的记录。解决办法:使用expla....

文章 2021-12-28 来自:开发者社区

【阿里年薪百万数据库面试】MySQL会丢数据吗?(下)

日志逻辑序列号(log sequence number,LSN)LSN单调递增,对应redo log的写入点。比如写入length长度的redo log, 则LSN+length。LSN也会写到InnoDB的数据,以确保数据页不会被多次执行重复的redo log。如图3所示,是三个并发事务(trx1, trx2, trx3)在prepare 阶段,都写完redo log buffer,持久化到磁....

【阿里年薪百万数据库面试】MySQL会丢数据吗?(下)
文章 2021-12-28 来自:开发者社区

【阿里年薪百万数据库面试】MySQL会丢数据吗?(上)

在业务高峰期临时提升性能的方法。WAL机制保证只要redo log和binlog保证持久化到磁盘,就能确保MySQL异常重启后,数据可以恢复。binlog的写入机制事务执行过程中:先把日志写到binlog cache事务提交时,再把binlog cache写到binlog文件一个事务的binlog不该被拆开,不论事务多大,也要确保一次写入。这就涉及binlog cache的保存问题。系统给bin....

问答 2020-05-23 来自:开发者社区

实现一个 normalize 函数,能将输入的特定的字符串转化为特定的结构化数据#前端面试

实现一个 normalize 函数,能将输入的特定的字符串转化为特定的结构化数据#前端面试

文章 2020-05-04 来自:开发者社区

拼多多面试题:如何查找前20%的数据?

【题目】 用户访问次数表,列名包括用户编号、用户类型、访问量。要求在剔除访问次数前20%的用户后,每类用户的平均访问次数。(拼多多、网易面试题) 【解题思路】 使用逻辑树分析方法可以把这个复杂的问题拆解为3个子问题:1)找出访问次数前20%的用户2)剔除访问次数前20%的用户3)每类用户的平均访问次数 下面分别来解决每个子问题 1.访问次数前20%的用户 先按“访问次数”排名,然后就可以找到”前....

问答 2019-11-11 来自:开发者社区

【精品问答】Python数据爬取面试题库100问

Python爬虫面试题库100问: 1.遇到过得反爬虫策略以及解决方法? 2.urllib 和 urllib2 的区别? 3.列举网络爬虫所用到的网络数据包,解析包? 4.简述一下爬虫的步骤? 5.遇到反爬机制怎么处理? 6.常见的HTTP方法有哪些? 7.说一说redis-scrapy中redis的作用? 8.遇到的反爬虫策略以及解决方法? 9.防范网站爬虫,应该怎么来提高爬取的难度 ? 10....

文章 2019-07-30 来自:开发者社区

给软件工程师、数据科学家和数据工程师的面试指南:该做与不该做

点击图片或戳我查看详情和投简历 亚马逊这样的公司有 14 项领导原则 。他们不想仅仅雇佣一个数据科学家或软件工程师。对于许多只进行一次或两次面试的面试者来说,这可能没有那么明显,因为你太专注于回答面试的技术部分。但是,在你进行技术面试时,我们希望提供一些提示,帮助你更好地为未来做好准备。 技术面试应该准备哪些? 准备好数字指标 我回忆起我在 FAANG ( Facebook、Apple、Ama.....

给软件工程师、数据科学家和数据工程师的面试指南:该做与不该做

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Java面试那些事儿

手把手带您学习Java,开启编程之路。

+关注