新型网络搜索引擎(20网络搜索引擎都包含哪些主要的技术?)

skyadmin 25 2023-03-05

本文目录一览:

类似于百度的软件还有哪些?

1、Google

谷歌公司(Google Inc.)成立于1998年9月4日,由拉里·佩奇和谢尔盖·布林共同创建,被公认为全球最大的搜索引擎公司。

谷歌是一家位于美国的跨国科技企业,业务包括互联网搜索、云计算、广告技术等,同时开发并提供大量基于互联网的产品与服务,其主要利润来自于AdWords等广告服务。

2、必应

微软必应(英文名:Bing)是微软公司于2009年5月28日推出,用以取代Live Search的全新搜索引擎服务。为符合中国用户使用习惯,Bing中文品牌名为“必应”。

3、神马搜索

神马搜索是UC和阿里2013年已经成立合资公司推出的移动搜索引擎,2015年3月11日神马搜索宣布,与云知声达成战略合作,将共同探索语音搜索创新,以满足智能移动硬件设备用户需求。

4、搜狗

搜狗搜索是中国领先的中文搜索引擎,致力于中文互联网信息的深度挖掘,帮助中国上亿网民加快信息获取速度,为用户创造价值。

5、360搜索

360综合搜索,  属于元搜索引擎,是搜索引擎的一种,是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,道是对分布于网络的多种检索工具的全局控制机制。

扩展资料:

主要特点:

1、信息抓取迅速。

在大数据时代,网络产生的信息浩如烟海,令人无所适从,难以得到自己需要的信息资源。在搜索引擎技术的帮助下,利用关键词、高级语法等检索方式就可以快速捕捉到相关度极高的匹配信息。

2、深入开展信息挖掘。

搜索引擎在捕获用户需求的信息的同时,还能对检索的信息加以一定维度的分析,以引导其对信息的使用与认识。例如,用户可以根据检索到的信息条目判断检索对象的热度,还可以根据检索到的信息分布给出高相关性的同类对象,还可以利用检索到的信息智能化给出用户解决方案,等等。

3、检索内容的多样化和广泛性。

随着搜索引擎技术的日益成熟,当代搜索引擎技术几乎可以支持各种数据类型的检索,例如自然语言、智能语言、机器语言等各种语言。目前,不仅视频、音频、图像可以被检索,而且人类面部特征、指纹、特定动作等也可以被检索到。可以想象,在未来几乎一切数据类型都可能成为搜索引擎的检索对象。

参考资料:百度百科-Google

参考资料:百度百科-必应

搜索引擎优化的发展历史

搜索引擎优化(SEO)不是突然出现的一个技术,而是和搜索引擎同步发展起来的,两者的关系虽然不能说是“矛和盾”的关系,但是可以肯定的是,因为有SEO才使得搜索引擎技术能够变得更完善。

一、1994-1997年:雅虎诞生与SEO诞生

1993年8月,Lycos推出了基于搜索机器人的数据发现技术,并支持搜索结果相关性排序额,它还第一次让搜索引擎能够使用网页自动摘要。

1995年底,Alta Vista推出,由于它具备大量的新的搜索功能,深受大众好评,Alta Vista是第一个支持自然语言搜索,具备了基于网页内容分析、智能处理的能力,第一个实现高级搜索语法的搜索引擎(如AND,OR,NOR等),同时还能搜索新闻群组中的内容,还能搜索图片。

这一阶段也是yahoo发展的初期阶段,大多数人在这个时候对搜索并不熟悉,也不太知道有搜索引擎这回事,但是对于yahoo,大多数人则有所了解,寻找网站就上Yahoo。所以,将你的网站送到Yahoo是很必要的,在此阶段,只要你的网站基本有个模样,有一定的可看性,一般只要向Yahoo提交地址,72小时内就能出现在Yahoo目录上。Yahoo对所有的网站进行人工归类,一般是按照字母顺序排列网站,自然开头为“A”的网站排到开头为“B”的前面,而有两个A的网站,排在有A和B的网站前面,比如,American Airlines的网站不仅排在Bank of America的前面,而且也排在American Basketball Association前面。所以,大批网站就以追求A字来命名。这是搜索引擎优化的雏形。这个逻辑和黄页电话号码的排名逻辑一样。

在这一阶段,Yahoo的栏目编辑们也在网上积极搜索新的网站,丰富他们的数据库,而他们的搜索都是人工的,最典型的方法就是从一个网站的链接去访问另外一个网站。遇到一个好的网站,他们就给站主发电子邮件,欢迎站主登录,而且都是免费的。

这些Yahoo编辑访问网站的行为和我们今天看到的搜索引擎蜘蛛和机器人的形式是一样的孜孜不倦。有个Yahoo编辑这么关心你的网站,比你还着急登录你的网站,而且一文不收,这个在今天是无法想象的。你的网站登录后,你还可以随时更改登录的信息,一般72小时就得到了更新。

值得一提的是,虽然在这个时期中文网站很少,而且大多数是美国的中文网和在台湾的网站,但是Yahoo显然注意到中文网站的未来,而且迅速有个中文译名“雅虎”,而这个不仅仅是因为它的创始人是杨致远。

这一阶段也是SEO的雏形时期。网上网下出现了一些论文,讨论文字对应、数据挖掘和对搜索引擎程序员的访谈。人们初步有了让网页内容符合搜索引擎数据库原理的模糊意识。同样,将网站收录到搜索引擎也是很容易的,你的网页只要关键词的使用达到一定密度就轻而易举地排列在搜索引擎上了。

值得一提的是,搜索引擎InfoSeek首次做到每日更新。早晨八点你提交网站,下午就被收录,第二天就能出现在搜索之中。正是因为这么快的更新和这么容易的提交收录,大量的站主开始变着法子频繁登录不同的网址,英文出现Spam这个词来形容站主不负责地制造泛滥的垃圾,很快使这些搜索引擎吃不消。

所以,SEO从一开始就是黑白两道开始的。白的,英文里是white-hat,就是按照能够悟出的搜索引擎原理来合理地调整自己的网站,使搜索引擎能收录并得到好的曝光。黑道,英文叫black-hat,这类优化者仿佛是黑客,寻找搜索引擎的弱点,力图将混淆的信息强塞给搜索引擎,从而为真实的网站提高曝光机会。

这个时期,因为强大的利润诱惑,成人网站可以说是带头去“黑”搜索引擎。所以SEO和搜索引擎从一开始就是爱和恨的关系,这个时期,收费的网站优化服务也开始在美国出现。

在中文搜索引擎领域,中国的起步其实并不晚。1996年8月成立的搜狐公司是最早参与做类似Yahoo的管理信息分类导航的网站,曾一度有“出门找地图,上网找搜狐”的美誉。

这个时候,没有人注意在斯坦福大学的一个宿舍里,两个聪明的学生正在慢慢孕育一个令世界瞩目的新型搜索引擎。他们发明了一个新的叫PageRank的理论,来重新塑造搜索引擎。这个新型搜索引擎就是现在的Google。

二、1998-1999年:Google和SEO理论浮现

这一阶段,美国的互联网大会开始有一些关于网站优化的文章发表。这些文章开始关注到链接流行度(Link Popularity)、名录网站链接(Directory Listing)的意义。这段时间,搜索引擎也知道了需要限制人们的网站提交来防止垃圾网站的泛滥,于是开始组织反击。

Alta Vista开始大规模剔除含有“我们来优化”或者“我们来推广”这类文字的网页。SEO的实践者开始意识到,要破解搜索引擎的原理越来越难。在1999年将一个网站提升到前十名要比在1998年难上十倍。搜索引擎开始更多关注链接流行度的意义。

Google也在1998年收到了第一张十万美元的风险投资,搬出了斯坦福校园,正式命名为Google公司,域名也从google.stanford. edu变成google. com。这个新的搜索引擎衡量网站的重要性首次将链接流行度作为排名的标准之一。

1999年5月,英国的FAST公司推出ALLTheWeb搜索引擎。它的网页搜索可利用ODP自动分类,支持Flash和PDF文件搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3和FTP搜索,拥有极其强大的高级搜索功能。这么强大的功能使它成为最流行的搜索引擎之一。

这一阶段的初期,搜索引擎也开始了多元化的进程,开始设立多语种的网站,比如AltaVista就率先开始了拉丁语的版本。台湾中正大学吴升教授所领导的GAIS实验室于1998年1月创立了OpenFind中文搜索引擎。它是最早开发的中文智能搜索引擎,号称能抓取全球最多的网页并开始进入英文搜索引擎。

1999年Google获得了两千五百万的资金,开始全力发展,并且已经在每天处理50万次搜索,这个投资也使Google再次搬家到旧金山——硅谷地区叫Palo Alto的城市。Google也开始结识合作伙伴,从AOL到Netscape不久,Google再次搬家到的全球总部依然是旧金山——硅谷叫Mountain View的城市。这时候的搜索引擎开始设法控制市场,广告广泛地出现在搜索引擎上。这引起了许多搜索者的反感,因为大家还是在用56KB modem上网,大量的广告使网站页面出现的太慢。

Google发现了这个影响搜索步伐的致命的问题。简洁的网页设计使众人耳目一新,飞快地搜索速度更使得各个站主奔走相告,每个站主论坛都充满了对Google的极好评价,杂志的采访也是接连不断地对Google进行推荐,Google的全面演出就正式登台了。

三、百度和搜索引擎的革新

从2000年开始,登录一个网站到搜索引擎花的时间是越来越长。搜索引擎热衷于收费服务,从一个新的搜索引擎Inktomi到Alta Vista都染上了金钱。与此同时,搜索者希望有一个搜索引擎能真正地给他们带来有用的信息。Google没有辜负人民的期望,它的精确搜索开始巩固它在搜索引擎中的地位。

首先出局的是InfoSeek,这个InfoSeek在1998被迪士尼公司买下,变成Go. com。从那以后,InfoSeek被抛弃,而Go. com也使用Yahoo搜索来代替。在1999年,InfoSeek的一位华人工程师离开了这个搜索引擎而驶向北京,他力图要创立一个“中国人自己”的搜索引擎,并且受一句中国古词“众里寻他千百度,蓦然回首,那人却在灯火阑珊处”的启发,将中国人的搜索引擎起名叫“百度”。这个工程师就是百度的创始人之一—李彦宏。

李彦宏自己就是新一代的搜索技术专家,他早在1996年就解决了如何将基于网页质量的排序与基于相关性排序完美结合的问题,并获得美国专利。百度公司结合硅谷搜索引擎人才精英,依托北京最优秀的软件人才,开发了大型商业化的中文搜索引擎,中文搜索从此与英文搜索站在了同一起跑线上,同时,百度搜索巧妙地解决了数据更新的瓶颈,整个中文网页的数据库可以最快每天更新一次。

2000年也是Flash动画、JavaScript特技Rollover和动态图片的流行之年。这些动态的形式让人喜爱,但是很少有人知道,搜索引擎不能认识这些,搜索引擎只能阅读文字,而非这些感官的创意,因为它们一直是在模拟人的阅读方式,但是却无法模拟人的感知,直到今天,搜索引擎也没有解决这个问题。

从这一年开始,实际上,向搜索引擎呈交新的网站不需要按照以前那样在搜索引擎的页面上填写“ADD URL”,搜索引擎已经能从一个存在的网站上发现新网站的链接来访问并收录。在这个时候,SEO实践者也开始知道,如果网站能被目录导航站(Directory),特别是开放目录ODP(Open Directory Project)收录,将非常有助于搜索排名的提升。最知名的ODP是DMOZ(www. dmoz. org),由尼克·斯冠塔河鲍勃·图尔两位Sun公司的工程师在1998年创办,它是一个人工来收录网站进行分类的目录网站。在这点上,它的组成和Yahoo是一样的。

不同的是,它是由全球的站主自己做编辑来维护的,而Yahoo是由专业编辑来维护的。关于DMOZ,搜索引擎青睐DMOZ,是因为经过人工分析的网站的可信度自然要高于搜索引擎蜘蛛和机器人来获取的网站信息可靠。

2001年的收费登录大为红火。搜索引擎市场经历大清洗,人们开始抛弃搜索引擎Hotbot,Alta Vista和Excite。Alta Vista试图仿效Google方式来重新回到缩小版的搜索引擎,但是这个垂死挣扎非常痛苦地失败了,并在2003年被Yahoo收购。Inktomi也失去了好几个应用伙伴,急剧走下坡路,2004年同样被Yahoo收购,而且成为了今天Yahoo搜索的主要核心技术。

四、2002-2007年:Google Dance和SEO的不眠之夜

其实在2001年,敏感的站主和SEO实践者感觉到了一个从未有过的现象。有些人对网站在Google上的排名一夜之间消失,而有的网站则名列首位。这个现象几乎是每月一次。后来,人们知道,这就是Google定期地更新它的索引(Index)的距离活动,给人的感觉就像跳舞一样,因此被SEO实践者称为Google Dance。

正是因为有Google Dance,每个SEO实践者都在Google更新的那个晚上熬夜地看自己的SEO成果能否在Google上实现。每次更新有赢家和输家,网上SEO论坛总有成千上万的讨论,期望知道下次更新能有什么可以预料的,或者猜测更新的具体日期。

搜索引擎在这个阶段中遇到更严重的泛滥问题。SEO实践者大量采用门户网页(Doorway Page)、重复网站(Duplicate Website)、伪装网页(Cloaked Page)、隐藏链接(Hidden Links)等来试图欺骗Google。另外,DMOZ被Google作为一个重要的收录新网站的渠道,DMOZ也被注入许多垃圾网站。

2002年是大量SEO被滥用的一年。但是,搜索引擎从这些与SEO非法实践的斗争中不断丰富自己的辨别技术,对抓住的网站拒绝收录,已经收录的则给予剔除。但是这个封锁也冤枉了不少诚实的SEO网站。

在中国,百度于2001年9月开始提供公共搜索服务,并成功地使搜狐和新浪开始使用它的搜索技术。同时,它还提供新闻搜索服务,迅速扩大用户群。

2003年,越来越多的网站设计对Flash的应用有了谨慎的态度。这一年也是搜索引擎继续反击垃圾泛滥的一年。许多SEO实践者明白黑帽技术(black-hat)已经行不通,而是要扎扎实实地真正提高网站的素质。

Google在2003年更是挤掉了AltaVista和Inktomi,成为独大。Google诞生于一个搜索引擎纷杂的时代,在那个时代,像Alta Vista等搜索引擎对自己的市场份额太具信心而懒得变化。Google由各个站主和SEO实践者宣扬,从而一举后来居上。Google开始反击垃圾泛滥,矛头直接对向曾经支持它的这些站主和SEO实践者。这些人成了Google成功的牺牲品。

2003年的Google的“佛罗里达更新”(Florida Update)真是让全世界的站主领教了Google的厉害。倘若强烈飓风一般,Florida Update一夜之间让千万个网站从搜索中消失或者从前十名刮到100页以后。这个发生在11月16日的更新,尤其对寄希望在即将来临的圣诞节狠赚一笔的电子商务网站损失惨重。Google的这个更新是反击垃圾网站和不法SEO行为的一次重要战役。

然而,由于使用的过滤器(filter)不完美,冲击了很多无辜网站。之所以叫“佛罗里达更新”,是因为这个更新由Google在佛罗里达的数据中心开始的。

之后,2004年1月叫做“Austin Update”的余波同样也对相当多的网站造成冲击。霎时间,所以SEO实践者都突然摇身变成了Google Adwords的专家,大家不能不依靠Google广告来维持这段节日期间的销售。

关于这两个历史性的Google更新,给了许多SEO实践者相当大的教训。规规矩矩地从改善网站本身的素质而不是投机取巧,成为了SEO唯一可行的方法。PPC也稳定的成为营销策略中的重要手段,而SEO也成为搜索引擎营销(SEM)的一部分。

Yahoo在这个时候决定与Google正式分道扬镳。长久以来,为了弥补自己靠人工收录网站的不足,Yahoo一直采用Google的技术来提供网络搜索。Yahoo显示陆续购入Alta Vista,AllTheWeb和Inktomi公司,让人觉察到Yahoo的心情——它是否间接养大了Google?它的手上还有20%Google的股份!终于,在2004年2月16日,Yahoo出售了Google股份,正式告别Google,走上自己开发搜索引擎的道路。

同年,2004年9月12日,Google推出简体及繁体两种中文版本的搜索引擎。

进入2005年,最大的变化是Google Update不再是定期的活动,而是逐渐地成为每天的递进更新。剧烈的变化不再看见。SEO实践者能够很快看到自己的努力是否出现了效果。遵循搜索引擎的纪律,以合理的方法来调整、提高网站的结构和内容,成为唯一能够保证网站稳定的方法。更重要的是,遵循这些规范操作而优化的网站,不仅在Google上排名良好,还会在Yahoo和MSN上也具有不错的结果。中文网站,如果扎实地做好网站的素质,也会在百度的排名上获益。

最好的搜索引擎推荐几个

百度、DuckDuckGo、必应都可以的。

1.百度搜索(全球最大的中文搜索引擎)

百度搜索是全球最大的中文搜索引擎,2000年1月由李彦宏、徐勇两人创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。

“百度”二字源于中国宋朝词人辛弃疾的《青玉案》诗句:“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。

2017年11月,百度搜索将推出惊雷算法,严厉打击通过刷点击,提升网站搜索排序的作弊行为;以此保证搜索用户体验,促进搜索内容生态良性发展。

2.Duck

Duck

Go

DuckDuckGo是一个互联网搜寻引擎,其总部位于美国宾州Valley

Forge市。

DuckDuckGo强调在传统搜寻引擎的基础上引入各大Web

2.0站点的内容。其办站哲学主张维护使用者的隐私权,并承诺不监控、不记录使用者的搜寻内容。

3.必应

微软必应(英文名:Bing)是微软公司于2009年5月28日推出,用以取代Live

Search的全新搜索引擎服务。为符合中国用户使用习惯,Bing中文品牌名为“必应”。作为全球领先的搜索引擎之一。

网络信息检索的现状与发展

网络信息检索的现状与发展

1990年以前,网络信息检索的现状与发展没有任何人能够检索互联网上的信息。应该说,所有的网络信息检索工具都是从1990年的Alan Emtage等人发明的Archie开始的,虽然它当时只可以实现简单意义上的FTP文件检索。随着World Wide Web的出现和发展,基于网页的信息检索工具出现并迅速发展起来。1995年基于网络信息检索工具本身的检索工具元搜索引擎由美国华盛顿大学的Eric Selberg 等发明。伴随着网络技术的发展,网络信息检索工具也取得了十足的发展,那么这些检索工具的现状和发展趋势如何呢?本文将试作以探讨。

1.基于网页的网络信息检索工具的现状和发展趋势

1.1现状。网页是因特网的最主要的组成部份,也是人们获取网络信息的最主要的来源,为了方便人们在大量繁杂的网页中找寻自己需要的信息,这类检索工具发展的最快。一般认为,基于网页的信息检索工具主要有网页搜索引擎和网络分类目录两种。网页搜索引擎是通过“网络蜘蛛”等网页自动搜寻软件搜索到网页,然后自动给网页上的某些或全部字符做上索引,形成目标摘要格式文件以及网络可访问的数据库,供人们检索网络信息的检索工具。网络目录则是和搜索引擎完全不同,它不会将整个网络中每个网站的所有页面都放进去,而是由专业人员谨慎地选择网站的首页,将其放入相应的类目中。网络目录的信息量要比搜索引擎少得多,再加上不同的网络目录分类标准有些混乱,不便人们使用,因此虽然它标引质量比较高,利用它的人还是要比利用搜索引擎的人少的多。

但是由于网络信息的复杂性和网络检索技术的限制,这类检索工具也有着明显的不足。(1)随着网页数量的迅猛增加,人工无法对其进行有效的分类、索引和利用。网络用户面对的是数量巨大的未组织信息,简单的关键词搜索,返回的信息数量之大,让用户无法承受。(2)信息有用性评价困难。一些站点在网页中大量重复某些关键字,使得容易被某些著名的搜索引擎选中,以期借此提高站点的地位,但事实上却可能没有提供任何对用户有价值的信息。(3) 网络信息日新月异的变更,人们总是期望挑出最新的信息。然而网络信息时刻变动,实时搜索几乎不可能,就是刚刚浏览过的网页,也随时都有更新、过期、删除的可能。

1.2发展趋势。网络信息检索工具的发展主要体现在进一步改进、完善检索工具和检索技术,以提高检索服务质量,改变网络信息检索不尽如意的地方。主要体现在以下几个方面:

1.21网络检索工具开发提供商之间合作越来越紧密。过去一般网络检索工具提供商只依靠自己建立的数据库来提供检索服务,检索范围有限,而现在某些著名的搜索引擎在购买其他公司的数据库或者技术内核,有的与其他搜索引擎建立伙伴关系,以便用户使用。比如著名雅虎现在采用的是Google的搜索内核,网易也曾经使用Google的搜索内核技术来丰富自己的搜索引擎数据库,硅谷动力、广州视窗、新浪、搜狐、Chinaren、21cn、263、Tom等搜索引擎使用融合了百度的搜索内核技术等等。

1.22信息检索工具专业化及服务内容深化。一些检索工具已经不再盲目追求加大收录和标引量,而更加注重突出专业特色。在lycos搜索引擎目录中,我们可以看到商业搜索引擎、IT搜索引擎、人才搜索引擎、金融搜索引擎、医学搜索引擎等专业化的网络信息检索纷纷出现,信息检索工具的专业化已经成为一种不可逆转的趋势。信息检索服务商将服务更加深化:Google推出了网页引文查询服务,通过它可以查看自己所要查询的资料被其他网站引用的情况,从而使用户更好的把握网页信息的质量;2003年8月,第三代中文搜索引擎慧聪问世,它则集“广泛的地域搜索”、“强大的行业搜索”、“完美的MP3、Flash搜索”众多搜索功能为一体,还开发了“针对内容的相关性查询”和“符合汉语特性的模糊查询”,可以实现汉语拼音查询和同音词纠错。

1.23网络信息工具智能化的发展趋势:(1)信息检索工具的智能化首先是网络蜘蛛的智能化。针对网络信息的动态更替性,网络蜘蛛通过启发式学习采取最有效的搜索策略,选择最佳时机获取从Internet上自动收集、整理的信息。网络蜘蛛能在网络的任何地方工作,能尽可能地挖掘和获得信息。网络蜘蛛还要有网页跟踪监测功能,如果网页出现更新、删除等情况要及时在数据库中更新。网络蜘蛛具有跨平台工作和处理多种混合文档结构的能力。(2)其次是检索软件的智能化。现在主要有智能搜索引擎、智能浏览器、智能代理。这些网络检索工具都非常重视开发实现基于自然语言形式的输入,检索者可以将自己的检索提问以及所习惯的短语、词组甚至句子等自然语言的形式输入,智能化的检索软件将能够自动分析,而后形成检索策略进行检索。比如现在的百度搜索可以在你输入关键词以后,不断提供一些相近的关键词供你选择,直至找到你所需要的结果。Google则借助于机器翻译技术,将一种自然语言转变成另外一种自然语言,使用户能够使用母语搜索非母语的网页,并以母语浏览搜索结果。尤里卡、问一问、和国外的ASK Jeeves则通过语义技术和检索技术的结合,可是实现检索工具对搜索词在语义层次上的理解,为用户提供最准确地检索服务。

2.基于FTP文件的搜索工具。

2.1现状。如前所述,搜索引擎的雏形以及最早的搜索引擎都是基于FTP文件搜索的。最早的FTP搜索引擎是基于文本显示的Archie。后来由于WEB的出现,FTP搜索引擎发展受到了一定的影响。直到基于WEB的FTP搜索引擎出现,它才越来越多受到人们的欢迎,用户量也在迅速上升,重要性也日渐显现出来。FTP搜索引擎的功能是搜集匿名FTP服务器提供的目录列表并向用户提供文件信息的查询服务。目前,国内做的最好的、规模最大的当属天网FTP文件搜索引擎,现在可以搜索2400万个文件(数据来源于天网主页),2002年时的统计日访问量是40万次,这在世界FTP搜索引擎界也算是一个佼佼者。另外国内还有清华9#搜索引擎、西安交大思源搜索、华南木棉搜索引擎、网络指南针、中科大天狼搜索引擎以及南京理工的“一网打尽”搜索引擎等等,国外的有Philes.com、AlltheWeb.com、Filesearching.com、souborak.com和ftpfind.com等,其中ftpfind.com是目前国外最先进的,支持包括站点快照和文件分类等新兴功能,而且文件数据量非常大。

近几年来,虽然FTP搜索引擎技术发展的很快,但相对WWW搜索引擎而言,FTP搜索引擎为数不多,技术上也还不十分成熟,还有很多需要改进的地方:(1)FTP搜索引擎的收录数量还比较少,搜索引擎的规模和质量还是要取决于其维护的信息量。据统计,全球匿名FTP服务提供的文件条目已经有数亿条,即便是目前规模最大的Philes.com,据陈华、李晓明2002年7月份统计也只有209,698,206 个文件。(2)检索功能还不完善。检索功能是一个搜索引擎最重要的部分,有很多搜索引擎还不能支持“and”和“or”等简单的布尔检索,使得数据库中的文件不能被检索到。(3)FTP服务器本身特点决定了FTP搜索引擎弱点,即由于FTP服务器有开放时间、有的还限制IP地址、有的限制登陆的用户量、不同的服务器设立的联接端口号并不相同等决定了其搜索到的结果有一部分是不能访问的,大大降低了用户的满意度。

2.2发展趋势。正如前文所述,FTP文件搜索引擎技术还不是很成熟,但其发展非常迅速,其发展趋势主要表现在以下几个方面:(1)检索功能日益丰富。天网FTP文件搜索引擎现在可以实现以文件大小、文件的上传日期、以及网段(比如说是华北网、华东网等)等多个条件的高级检索来限制检索结果;AlltheWeb.com增加了检索方式(规则表达检索、准确检索、浏览、对大小写敏感与否等等),限制主机(是edu还是gov或者com等),文件类型以及文件大小、日期等功能。(2)检索服务的个性化。现在FTP搜索引擎研究者已经开始注意这一方面,天网ftp搜索引擎已经有了很多可以个性化的选项:可以设置用户不同偏好的排序方式,可以设定国外文件优先还是本国文件优先,对于国外用户是不是应该国外文件优先,是FTP上文件优先还是WWW上的文件优先,是选择中文的还是英文的等等。AlltheWeb.com则是可以完成更丰富的个性化设置,比如说可以选择一个主机提供一个结果、设置语言、搜索的文件大小设置、是否亮度显示搜索关键词、设置使用者语言、以及键盘快捷键等等。

3.基于网络检索工具的检索技术的现状和发展趋势。

3.1随着网上信息资源的膨胀发展,一种搜索引擎,无论它多么完善都不可能满足一个人所有的检索需求。如果遇到文献普查、专题查询、新闻调查与溯源、软件及MP3下载地址搜索等情况,人们就更需要使用多种搜索引擎来比较、筛选和相互印证。为解决逐一登陆各搜索引擎,在各搜索引擎中分别多次输入同一检索请求(检索字串)等烦琐操作,基于网络检索工具的检索工具产生了。

目前这列检索工具只要有两种:集成搜索引擎和元搜索引擎。所谓集成搜索引擎是在一个检索界面上链接若干种独立的搜索引擎,检索时,一次检索输入,可以指定搜索引擎也可以要求多个引擎同时检索,搜索结果由各搜索引擎分别以不同页面提交的网络检索工具,其实是利用网站链接技术形成的搜索引擎集合。集成搜索引擎制作与维护技术简单,可随时对所链接的搜索引擎进行增删调整和及时更新,尤其大规模专业(如FLASH、MP3等)搜索引擎集成链接,深受特定用户群欢迎。如国内天网搜霸和百度搜霸,国外比较著名的有“搜索之家”()、“网际瑞士军刀”()等。另一个是元搜索引擎,用户只需递交一次检索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一的格式呈现到用户面前。国外比较著名的元搜索引擎有Vivisimo、EZ2WWW、Kartoo、SurfWax、Fazzle(以上五个为2002年度的最佳元搜索引擎)等。目前国内现在还没有见到真正意义上的元搜索引擎。元搜索引擎虽没有网页搜寻机制,亦无独立的索引数据库,但在检索请求提交、检索接口代理和检索结果显示等方面,均有自己研发的特色元搜索技术支持。目前元搜索引擎技术主要有并行处理式和串行处理式两大类。并行式元搜索引擎运行时是将查询请求同时发向各个独立搜索引擎,然后将的结果按特定的顺序呈现给用户;串行式元搜索引擎运行时是将查询请求先发向某个独立搜索引擎,待其返回结果后再将请求发往另一个独立搜索引擎。

从第一个元搜索引擎Metacrawler诞生至今,这一新型的网络检索工具异军突起,发展迅速,目前可用的元搜索引擎已近百种。由于元搜索引擎的功能受着源搜索引擎和元搜索技术的双重制约,元搜索引擎比较理想的并不多见。信息检索专家邢志宇将元搜索引擎存在的问题归纳如下:(1)大多元搜索引擎不支持多语种,尤其是汉语检索;(2)一些元搜索引擎实现检索语法转换的能力有限,不支持指定字段检索,不能充分发挥各个独立搜索引擎的高级检索功能;(3)部分元搜索引擎无源搜索引擎列表,用户不能自主选择和调用源搜索引擎;(4)大部分元搜索引擎仅支持调用AltaVista、Excite、GoTo.com、Yahoo!、Infoseek、Lycos等常用的搜索引擎,一些大型搜索引擎如NorthernLight、HotBot等被排除在外,人为地限制了搜索资源的利用;(5)在检索结果上,元搜索引擎只能返回十几、数十条“相关度”较高的结果,大量可能有价值的源搜索引擎的检索结果被忽视,影响检索结果的全面性。

3.2发展趋势。这类检索工具的发展趋势主要表现在下面几个方面:(1)检索结果整理的深化。如Vivisimo、EZ2WWW、MetaCrawler等可以实现搜索结果的自动分类,用户即可以利用传统的方式浏览结果,也可以利用其同屏的分类结果提示找寻自己需要的内容。EZ2WWW高级搜索功能提供1000多种专项资源检索,可进行目录检索。SurfWax有一个其它元搜索引擎没有的独特功能,即点击每条结果左边的“网址揿钮”图标,可浏览该结果包括的任何页面,并显示搜索语句在文件中的位置,也可以把搜索结果和文件存储起来以备后用。天网搜霸已经拥有了独特的链接检测功能,在几秒钟内检查当前页面查询结果是否可以访问,如果为标注绿色,则链接可连通(目前仅检测页面内以http://和ftp://开头的链接)(2)检索界面的个性化趋势。天网搜霸和Google提供了IE浏览器的插件,安装后就会被嵌到IE的工具栏,用户不用登陆天网的主页,就可以实现检索。用户可以将自己喜欢的搜索引擎设置为主要搜索,也可以添加用户自己喜欢的搜索引擎。天网搜霸不久前刚刚推出了可以嵌在Windows系统任务栏上的插件,现在用户连打开IE浏览器都不需要了。Mamma可以选择使用短语检索功能、设定检索时间、设定每页可显示记录数,还提供了专门检索页面文件标题的特殊检索服务,以及通过E-mail传输检索结果的特色功能。MetaCrawler可以实现搜索引擎的选择调用,基于域名、地区或国家的检索结果过滤,最长检索时间设置,每页可显示的和允许每个搜索引擎返回的检索结果数量的设定,设定检索结果排序依据(包括相关度、域名、源搜索引擎)个性化定制保存。(3)智能化。ProFusion可以自动实现符合特殊检索语法要求的转换,如在调用Excite、InfoSeek、WebCrawler时将“NEAR”转换成“AND”,在调用GoTo、Yahoo时将“NOT”删除等;Mamma也支持常用检索语法在不同搜索引擎中的转换;C4可以支持自然语言检索,虽然它没有自己的数据库,却可以提供网上的检索结果。

新型网络搜索引擎的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于20网络搜索引擎都包含哪些主要的技术?、新型网络搜索引擎的信息别忘了在云尚网络www.ysfad.net进行查找喔。

上一篇:优个网商城(优个网可靠吗)
下一篇:企业百度推广(企业百度推广怎么操作)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~