搜索源引擎(搜索引擎原理技术与系统)

skyadmin 34 2023-04-12

本文目录一览:

搜索引擎有哪些

搜索引擎有:Google、百度、搜狗、360搜索、微软必应。

1、Google

Google是基于全文索引的搜索引擎,源于斯坦福大学的BackRub项目,由LarryPage及Sergey Brin主要负责。1998年,BackRub更名为Google,并成立公司。发展至今,Google搜索涉及全球多种语言,是目前最有影响力的搜索引擎。

2、百度

作为中文搜索引擎的统治者,也许百度的技术不如Google。但是,百度在中国大陆的市场占有率方面远比Google大得多。自Google退出中国市场,百度在中国大陆的搜索市场份额就一路飙升,最高时号称占领中国大陆79%的搜索市场份额,直至360及搜狗的发力才有所回落。

3、搜狗

搜狗是搜狐公司于2004年推出的互动式搜索引擎,经历了将近10年的发展,搜狗的检索技术不断地成熟,在中文搜索引擎中也占有一席之地。特别是在2013年宣布与腾讯搜搜合并后,其覆盖人群进一步扩大,成为中文搜索引擎的一支后起之秀,号称市场占有率达12%。

4、360搜索

360于2013年8月推出了自有搜索引擎360搜索,凭借巨大的浏览器安装率,360搜索自上线之日起即获得相当可观的市场占有率。半年内更是攻城掠地,不仅将原Google的市场份额洗劫一空,更是不断深入百度及搜狗的腹地,成为中国大陆不可小视的力量。

5、微软必应

微软必应是微软公司于2009年5月28日推出的,用以取代Live Search的全新搜索引擎服务。为符合中国用户使用习惯,Bing中文品牌名为“必应”。作为最贴近中国用户的全球搜索引擎,微软必应一直致力于为中国用户提供了美观、高质量、国际化的中英文搜索服务。

什么是搜索引擎

搜索引擎是一个对互联网信息资源进行搜索整理和分类,并储存在网络数据库中供用户查询的系统,包括信息搜集、信息分类、用户查询三部分。

工作原理

1.爬行:搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”也被称为“机器人”。搜索引擎蜘蛛的爬行是被输入了一定的规则的,它需要遵从一些命令或文件的内容。

2.抓取存储:搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。其中的页面数据与用户浏览器得到的HTML是完全一样的。搜索引擎蜘蛛在抓取页面时,也做一定的重复内容检测,一旦遇到权重很低的网站上有大量抄袭、采集或者复制的内容,很可能就不再爬行。

3.预处理:搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理。

什么是搜索引擎?

搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。

一. 基本概念

搜索引擎指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。因特网上的信息浩瀚万千,而且毫无秩序,所有的信息像汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为用户绘制一幅一目了然的信息地图,供用户随时查阅。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。

二. 工作原理

1.抓取网页

每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。

2.处理网页

搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。

3.提供检索服务

用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。

搜索引擎是什么意思

指仔细查找、搜寻。

徐怀中《西线轶事》中:“在树棵里搜索了好久,什么也没有发现。”也指往来貌,接续貌。

《文选·王褒》:“玄猿悲啸,搜索乎其间。”李善注:“搜索,往来貌。”

明冯梦龙《东周列国志》第五十七回:“赵氏孤在宫中,索之不得,此天幸也!但可瞒过一时耳。后日事泄,屠贼又将搜索。必须用计,偷出宫门,藏于远地,方保无虞。”

南朝宋刘义庆《世说新语·政事》:“谢公时,兵厮逋亡,多近窜南塘下诸舫中;或欲求一时搜索,谢公不许。”

关于搜索源引擎和搜索引擎原理技术与系统的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注云尚网络www.ysfad.net。

上一篇:手机端搜索引擎排名(国内手机搜索引擎十大排行)
下一篇:新闻代发包收录(新闻发布代理)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~