“搜索”的原理,架构,实现,实践,面试不用再怕了(值得收藏)!!!
全网搜索引擎架构与流程如何? 全网搜索引擎的宏观架构如上图,核心子系统主要分为三部分(粉色部分): (1)spider爬虫系统; (2)search&index建立索引与查询索引系统,这个系统又主要分为两部分: 一部分用于生成索引数据build_index 一部分用于查询索引数据search_index (3)rank打分排序系统; 核心数据主要分为两部分(紫色部分): (1)w...

深入浅出搜索架构引擎、方案与细节(上)
一、缘起 《100亿数据1万属性数据架构设计》文章发布后,不少朋友对58同城自研搜索引擎E-search比较感兴趣,故专门撰文体系化的聊聊搜索引擎,从宏观到细节,希望把逻辑关系讲清楚,内容比较多,分上下两期。 主要内容如下,本篇(上)会重点介绍前三章: (1)全网搜索引擎架构与流程 (2)站内搜索引擎架构与流程 (3)搜索原理、流程与核心数据结构 (4)流量数据量由小到大,搜索方案与架构变迁 (....
“搜索”的原理,架构,实现,实践,面试不用再怕了(值得收藏)!!!
可能99%的同学不做搜索引擎,但99%的同学一定实现过检索功能。搜索,检索,这里面到底包含哪些技术的东西,希望本文能够给大家一些启示。 全网搜索引擎架构与流程如何? 全网搜索引擎的宏观架构如上图,核心子系统主要分为三部分(粉色部分): (1)spider爬虫系统; (2)search&index建立索引与查询索引系统,这个系统又主要分为两部分: 一部分用于生成索引数据build_ind.....
阿里如何实现秒级百万TPS?搜索离线大数据平台架构解读
背景 什么是搜索离线? 一个典型的商品搜索架构如下图所示,本文将要重点介绍的就是下图中的离线数据处理系统(Offline System)。 何谓离线?在阿里搜索工程体系中我们把搜索引擎、在线算分、SearchPlanner等ms级响应用户请求的服务称之为“在线”服务;与之相对应的,将各种来源数据转换处理后送入搜索引擎等“在线”服务的系统统称为“离线”系统。商品搜索的业务特性(海量数据、复杂业务.....
PostgreSQL 相似搜索分布式架构设计与实践 - dblink异步调用与多机并行(远程 游标+记录 UDF实例)
标签 PostgreSQL , 多表并行 , 多机并行 , dblink , 异步调用 , 相似搜索 背景 背景请参考如下: 《PostgreSQL 相似搜索设计与性能 - 地址、QA、POI等文本 毫秒级相似搜索实践》 当需要进行相似搜索的数据量大于单机处理能力时,我们需要水平拆分来提高搜索能力。 或者可以使用阿里云的PolarDB for PG的产品(类似ORACLE RAC,支持增加计...

框计算精确搜索之架构篇
一年多来,百度开放平台已经和400多家合作伙伴实现了合作,覆盖了人们出行、娱乐、商务、工作等方方面面。面对每天超过一亿次的海量搜索请求,如何精确地理解用户需求,将最优质恰当的资源用最优的样式展现给用户,这都需要一个优秀的检索架构来支撑。 对于一次检索请求,搜索框需要完成以下三步: 1.需求识别、精准分析 茴香豆的“茴”字有四种写法,而一个简单的天气查询需求却有上百种不同的表达形式,可...
SharePoint 2013 企业搜索架构示例
博客地址:http://blog.csdn.net/FoxDave 本文参考自微软官方的Chart,我们来看一下企业中对于不同规模SharePoint搜索的场的架构是什么样的。 对于搜索场的规模,我们用爬网的Item的数量来衡量。关于搜索过程和搜索组件的交互信息,查看Search Architectures for SharePoint® Server 2013。 搜索中的数据库有...
SharePoint 2013 开发——搜索架构及扩展
博客地址:http://blog.csdn.net/FoxDave SharePoint 2013高度整合了搜索引擎,在一个场中只有一个搜索服务应用程序(SSA)。它集成了FAST,只有一个代码库,不同的授权层次启用不同的搜索功能,但是有些功能在云端是不可用的。 下图从开发者的视角展示了搜索架构,摘选自SharePoint高级编程。 图中标记灰色的部分就是我们在开发过程中可以应用或扩展的...
陈爱云:打造坚如磐石的搜索架构
陈爱云,2010年毕业于天津大学,2013年加入爱奇艺,现任爱奇艺搜索架构组高级经理,致力于提高搜索系统的性能和高可用性。 打造坚如磐石的搜索架构 对于一个在线系统而言,性能和稳定性是永远要追求的两个方向,如果是分布式系统,性能不够可以用机器来凑(当然这不是最好的方法,性能的提升不是本文的关注点,所以这里不对提升性能的方法赘述),但是稳定性不能靠机器来堆,并且机器越来越多可能会带来更多的稳定...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
金融级分布式架构
SOFAStack™(Scalable Open Financial Architecture Stack)是一套用于快速构建金融级分布式架构的中间件,也是在金融场景里锤炼出来的最佳实践。
+关注