搜索引擎工作流程(搜索引擎工作流程是什么)
本文目录一览:
搜索引擎中的搜索器工作程序是
搜索引擎的工作包括如下过程:搜索器在因特网中发现、搜集网页信息;搜索引擎对所搜集的信息进行提取和组织,并建立索引库;由检索器根据用户输入的查询关键词,在索引库中快速检出相关文档,进行文档与查询内容的相关度比较,对检出的结果进行排序,并将查询结果返回给用户。
搜索引擎的工作过程分为哪几个阶段
搜索引擎的整个工作过程视为三个部分:蜘蛛在互联网上爬行和抓取网页信息,并存入原始网页数据库;对原始网页数据库中的信息进行提取和组织,并建立索引库;根据用户输入的关键词,快速找到相关文档,并对找到的结果进行排序,并将查询结果返回给用户。
1、网页抓取
Spider每遇到一个新文档,都要搜索其页面的链接网页。搜索引擎蜘蛛访问web页面的过程类似普通用户使用浏览器访问其页面,即B/S模式。引擎蜘蛛先向页面提出访问请求,服务器接受其访问请求并返回HTML代码后,把获取的HTML代码存入原始页面数据库。
2、预处理,建立索引
为了便于用户在数万亿级别以上的原始网页数据库中快速便捷地找到搜索结果,搜索引擎必须将spider抓取的原始web页面做预处理。网页预处理最主要过程是为网页建立全文索引,之后开始分析网页,最后建立倒排文件(也称反向索引)。
3、查询服务
在搜索引擎界面输入关键词,点击“搜索”按钮之后,搜索引擎程序开始对搜索词进行以下处理:分词处理、根据情况对整合搜索是否需要启动进行判断、找出错别字和拼写中出现的错误、把停止词去掉。接着搜索引擎程序便把包含搜索词的相关网页从索引数据库中找出,而且对网页进行排序,最后按照一定格式返回到“搜索”页面。
扩展资料
在信息抓取阶段搜索引擎掌握的信息往往是局部的,因而为搜索引擎设计一个好的抓取优先级策略并不是一件容易的事情,这里说的是一个深度抓取的优先策略。深度优先抓取它是以抓取到连接结构关系中的所有内容为主要目的的,具体实现方式是沿着树形的深度遍历树的节点,尽可能深的搜索树的分支,如果发现目标,则算法中止。
深度优先抓取过程中,抓取程序从起始页开始,一个链接一个链接跟踪下去,处理完这条线路最低端之后再转入下一个起始页,继续跟踪链接。
参考资料来源:百度百科-搜索引擎
参考资料来源:百度百科-搜索引擎技术
搜索引擎的工作流程
作为消费者,我们平时上网购物,为了节省时间,很多情况是直接输入自己想要的产品进行搜索,就可以轻松的找到。当然,如果从商家的角度出发,如何让潜在的客户迅速搜索到自己的产品是非常重要的。下面是以淘系电商平台为例,学习搜索的工作流程。
主要包含四大部份:
一、商品收录。
商品收录就是将平台上的产品收录到搜索引擎。并不是什么产品都会收录,一般未上架的产品不会被收录。只有上架了的产品才会被收录,收录后才有机会展现,才有可能会被消费者搜索得到。
二、商品索引。
商品索引过程非常复杂,是从多个服务器索引过来。
比如按点击付费的“直通车”,标有“hot”字样的是它的展示位置,但这种类型的展示位置是有限的。
“千人千面”是根据客人的不同购物习惯推荐不同的产品。由于不同的人群有不同的喜好,哪怕她们在同一时间搜索同样的关键词,得到的结果也是不相同的。
关于“新品”,新上架的产品没有任何标签.但是平台会给序一定的权重,哪怕是在销量不高的情况下,也会有机会排在前列。
三、用户搜索词处理 ,
1.拆分搜索关键词
2.拆分商品标题
3.是否包含搜索词根.
如果两者词根匹配,产品就可以在搜索结果中有展现的机会。
比如,消费者搜索的关键词为“高端品牌 外套”,这个词会被拆分为"高端","品牌","外套".。而平台收录的商品中,标题中含有"高端","品牌","外套"这些词根的商品就有机会展现。如下图展现的产品中,标题中都含有这些词根。
四、产品排序。
在产品排序中,展现具有类目优先性。词根与类目相同的关键词,产品会优先展示。在选词的时候,可以先查询该关键词的主要类目,对比其与产品类目是否一致。
在产品排序中,有些产品是无法展现的。
比如,过于低价的产品;主图违规的产品;涉嫌虚假交易的商品。
百度的搜索引擎的流程是什么?哪个高手指教一下.
分类: 电脑/网络 互联网
解析:
搜索引擎的工作原理
可以分为三个部分
1、抓取网页
每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
2、处理网页
搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分析超链接、计算网页的重要度。
3、提供检索服务
用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。

搜索引擎工作流程的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于搜索引擎工作流程是什么、搜索引擎工作流程的信息别忘了在云尚网络www.ysfad.net进行查找喔。
发表评论




暂时没有评论,来抢沙发吧~