Google中文搜索引擎功能与特点

http://www.google.com

Google搜索引擎是一个利用蜘蛛程序(Spider)以某种方法自动地在互联网中搜集和发现信息,并由索引器为搜集到的信息建立索引,从而提供面向网面的全文检索服务的互联网信息查询系统,它主要有以下特点和功能:

1)采用了先进的网页级别技术。这种技术是指依据网络自身结构,根据互联网本身的链接结构对相关网站用自动方法进行分类,清理混沌信息,整合组织资源,使网络井然有序。这种技术打破了传统网络分类概念,它是基于网页的自然结构,即任何网页均可直接地链接到另一网页,而无须任何媒介。

2)在同一个界面下,可以定制语言和到何种网站中进行搜索。因为Google将多国语言的搜索引擎整合到同一个界面,选择非常方便。它不像其他搜索引擎(如Yahoo)那样,要搜索不同语言版本的网站,必须先进入相应语言的网站。目前,Google已可以对包括中文在内的26种语言进行搜索。

3)搜索结果通常会比其他搜索引擎来得更准确。对于现实中许多不谙搜索引擎复杂系统的使用方式和规则的检索者,例如,不知道搜索引擎与分类目录的差别,不懂使用逻辑运算符,只会用单一关键字查询等的这些情况,Google都替他们考虑过,当输入关键字搜索时,它不仅会去搜索包含关键字的网页,同时还会搜索和这些网页具有高相关性的网页。因为Google具有超链分析的功能,即根据网页间彼此的连结关系,把一篇网页被连结数目的多寡视为相关性的一项指标,并根据相关性的高低排列出次序,以确定该网页的质量或重要度。

4)在查询时,Google能够通过提供多个关键字,将只提供包含所有关键字的网页,其正文或指向它的链接包含所输入所有关键字。而且,Google还能遵从关键字的相对位置,对网页关键字的接近度进行分析,按照关键字的接近度区分搜索结果的优先次序。在显示的结果中,只摘录包含查询字串的内容作为网页简介,查询字串高亮显示。

5)Google是目前收集亚洲网站最多的搜索引擎之一,对中文的支持性强。相对于许多国内研发的中文搜索引擎,Google不但大大提升了中文搜索引擎的相关性,还更好地实现了检索字串与网页中文字的语义上的匹配,从而提高了检索效率。例如,它支持中英文混合检索词查询,比如“甲A”,“F1-级方程式”等;它支持多种编码,比如“朱镕基”的“镕”字不在GB2312字符集中,但存在于GBK编码中,许多传统搜索引擎由于不支持GBK,便无法查到有关“朱镕基”的网页,而Google则可以直接找到;此外,对于所输入的中文关键字,Google不仅会去搜索中文简体网站,还会找出相应的中文繁体网站,甚至是日文网站。

6)Google的“手气不错”、“网页快照”和“类似网页”等功能。Google和一家名为Realnames(简称RN)的网络关键词管理公司有合作关系,其网络关键词是指可以链接到网站的商标、产品、服务或者公司名称,在网络中起注册商标的作用。当关键词与Google推荐的网站匹配时,在搜索结果中就会显示“RN”标记。例如,查询的目的是想进入一个特定的网站(如公司网站),只知道和该网站有关的一些局部信息(如该公司的产品等),这时,可通过输入产品名称和尽可能多的关键字来试试“手气不错”。

“网页快照”是指Google保存应急网页内容。它的作用是:当所要检索的网页在实际上可能已经过时或者不存在了,而由于搜索引擎数据库的更新需要一定的时间,无法跟得上那些更新速度快的网站,或是有时碰到网页服务器的暂时中断而找不到服务器,这时快照内容便可暂解燃眉之急。此外,其速度也比常规链接快,但信息可能不是最新的。

 

 图书馆利用法     anabull1.gif (2533 字节)向上返回页首     >>>网站推荐