搜索引擎的检索方式及检索技术

模糊查询与精确查询      逻辑查询       查询范围限制

搜索引擎一般设有简单检索与高级检索两种检索方式。简单查询就是根据你输入的关键词或查询语句不加限制地进行查询,这样得到的查询结果非常全,是不一定准。

复杂查询就是根据我们给出一些搜索引擎支持的查询各件,让搜索引擎查询出符合查询条件的信息,这样的查询结果一般很准确,如想查网址得到的是网址索引,而想查网页,得到的是网页索引,复杂条件查询,有时也称为高级查询,英文为Advanced Search。简单检索的结果往往不尽如人意,因为如果这些单词的使用频率较高,则反馈的信息就有可能多得让人无法应付;而如果这些单词过于“冷僻”,则反馈的信息又往往令人大失所望。

因此,各个搜索引擎,包括分类查询和全文查询的搜索引擎,通常都提供一些来限定查询的内容的控制选项和一些逻辑算符,使查询结果更精确地符合我们的要求。现在的搜索引擎一般都提供两种查询方法,即简单查询和复杂查询。

不同的搜索引擎,提供的复杂查询的功能和实现的方法各有不同,网站中一般都有“帮助”或“说明”解释各自的功能和方法。以下是一些常见的功能:

1.模糊查询与精确查询

模糊查询又称为智能查询。当我们输入一个关键词时,搜索引擎不但查出包括了关键词的网址,同时也发来与关键词意义相近的内容。比如,我们查找“查询”一词时,模糊查询会反馈回来包涵了“查询”、“查找”、“查一查”、“询找”、“搜索”等内容的网址:查询“计算机”时,会连带“电脑”一同反馈。查询结果的排列,一般按查询语句和查询结果的相关度排列,相关度越高的排在最前边,其次是相近的。一般的搜索引擎都有这一功能,只是模糊的程度不同。

模糊查询没有特殊的方法,只要在文字框中输入关键词即可。而在英文的查询中,还可以使用通配符星号(*)和问号(?),使关键词更为模糊。但查询中文时这一应用较少。

模糊查询往往会反馈来大量不需要的信息,如果想精确地只查某一个关键词,则可以使用精确查询功能。精确查询一般是在文字框中输入关键词时,在词组或语句的两边加上双引号,这样得到的查询结果更精确。

2.逻辑查询

由于模糊查询会将符合一个查询语句中的每一个查询词的信息资源都查询出来,查询结果相当庞大,而且含有许多我们不需要的内容。精确查询将引号内的词做为一个词组来处理,这样结果虽然准确,但却容易漏掉一些内容。如果我们需要的每一条信息是包含我们输入的多个关键词,但关键词不必以词组形式出现在篇名或内容中时,精确查询就显得无能为力了。为了满足这种查询需求,搜索引擎大都设置逻辑查询功能。这一功能允许我们输入多处关键词,而且,各关键词之间的关系可以是“与”(and)、“或”(or)、“非”(not)的关系。逻辑检索也称布尔检索。常用的逻辑检索有“AND”、“OR”和“NOT”。

AND表示逻辑“与”,有的搜索引擎也常用“&”,“+”,“,”和空格来表示。AND用于检索两个以上关键词的情形,检索的结果应该与这几个关键词都有关系。如“经济AND文化”,就表示既包括经济又包括文化。

OR表示逻辑“或”,有的搜索引擎用“|”来表示。检索的结果只要求与若干个关键词中的一个有关系即可,如“体操OR游泳”,就表示可以包括体操,也可以包括游泳。使用OR通常会得到许多无关紧要的信息,一般应慎重使用。

NOT表示逻辑“非”,有的搜索引擎用“!”表示。NOT检索的结果将完全排除与NOT后面的关键词有关的信息,如“水果NOT苹果”,就表示可以包括水果但其中不能有苹果。

一般能提供高级检索的搜索引擎,都支持逻辑检索,但有的是“完全支持”,如Excite,Infoseek等;有的则是“部分支持”,如Yahoo就只支持“AND”和“OR”;有的在其高级检索中“完全支持”而在其简单检索中则“部分支持”,如HotBot,Lycos等。中文搜索引擎一般不直接支持“AND”,“OR”和“NO”而是通过使用特殊的操作符如“+”,“—”,“|”,“!”等来达到同样的目的(注意在输入代表逻辑关系的字符时,一定要用半角)。

各搜索引擎实现这种查询的方式不尽相同,可以通过查阅其帮助文档来了解。

下边所列的例子,可以帮助你更好地理解什么是逻辑查询,同时也是一些较常见的用法。

①“与”,在关键词之间使用半角的加号(+)

1:查询网上关于法国足球、英国足球、巴西足球比较资料。

从查询要求表明有查询的内容必须同时包括“法国足球、英国足球,巴西足球”3个关键词,输入的查询式应为“英国足球+法国足球+巴西足球”。逻辑“与”的代表符号,有的搜索引擎不用+号,而用&号,还有用其他符号的,请注意查看说明。

“或”,使用半角的逗号把关键词分开

2:查询网上关于法国足球、英国足球和巴西足球的资料。

这个例子表示,查询的内容不必同时包括3个关键词,而只要包括其中任何一个即可,因此查询式应为“法国足球,英国足球,巴西足球”,有的搜索引擎使用空格,而非半角逗号。

“非”,将要排除的关键词前加半角的减号

3:查询除世界杯以外的有关足球的资料。

这一例子表示,查询的内容应包括“足球”,但必须没有“世界杯”字样。检索式应为“足球-世界杯”。

3.查询范围限制。

范围限制的功能,可以使我们在某一范围中查询和搜索指定的关键词。范围限制的能力越强,越能使我们更准确地找到需要的信息。搜索引擎提供的范围限制类型大体有以下几个方面:

·分类范围:在某一类别中查询,如自然科学、教育、商务、黄页等。

·地域范围“在某一地区中查询。

·时间范围:查询某一时间范围内建立的网站或编写的网页。

·信息来源限制。在某一类型的网站中查询,WWW、Ftp、Gopher、BBS、新闻组等。

·查询词位置限制。提供查询词必须出现在网址或是网页或其他位置的限制。这些范围限制,实现的方法各不相同,有些是通过关键词前加特殊的字符。

·其他特殊范围。一些搜索引擎,提供了许多特殊范围的限定,如域名后缀comgov、org等)、文件类型(文本、图形、声音等)。

查询范围的限制一是靠限制符来实现。例如在关键词前加上“t:”,搜索引擎将只检索网站或网页名称,如“t:数学”,则搜索引擎将只检索网站或网页名称中含有“数学”字样的对象。

在关键词前加上“u:”,搜索引擎将只检索网址(URL)、如“u: intel”,则搜索引擎将只检索网址中含有intel字样的对象。有些是通过下拉式菜单。我们需要查看所用引擎的帮助,详细了解。当然,不是每一个搜索引擎都同时具备这些功能,有些具备这些,有些具备那些,而优秀的引擎,功能会更多一些。

以上检索技术可组合使用。现有的搜索引擎大都采用自然语言与布尔语言查询并用的查询方法。用自然语言查询一般只能实现简单查询,查准率较低;用布尔语言查询采用and、or、not等算符,以及截词、邻近、括号嵌套表达式等限定方法,查准率较高。由于搜索引擎没有统一的建站标准,所以各家所用的查询方式及查询限制都各有不同,请在使用时先查看每个引擎的帮助文件或有关资料。

——选自林运卓编著《中小学教师信息检索与利用技能》(暨南大学出版社)

 图书馆利用法      anabull1.gif (2533 字节)向上返回页首       >>>网站推荐