搜索引擎使用策略与技巧

   由于网络信息搜索引擎较多,每一种搜索引擎其数据库覆盖的范围,标引的深度、广度,提供的检索方式、检索语法均不相同,因此利用搜索引擎进行网上信息检索时也应讲究检索策略,使用某些技巧来缩小或扩大检索范围。

1.根据检索课题选择搜索引擎。每个搜索引擎都有其自身的特点,不同的搜索引擎适合于完成不同类型的搜索任务,同一个检索关键词,在两个搜索引擎中并不会产生完全相同的检索结果。因此,完成有效检索之前,应当明确需要搜索的主题,列出与搜索主题有关的关键词清单和应当排除的词汇清单,然后根据具体的检索要求和对各个搜索引擎特征的了解,选择适合于自己的检索要求的搜索引擎。具体来说,当仅仅满足于在网上进行一般的浏览时,可以选择以分类目录为主的搜索引擎,如Yahoo、sohu等,也可以使用其他搜索引擎提供的分类目录索引;当要获得比较全面、丰富的资料时,就要选择以全文检索为主的搜索引擎,如AltaVista,HotBot等;如果想对某个专业或主题进行比较深入、专门的研究,则应该选择一些具有鲜明特色的专业搜索引擎,如适合于科技工作者使用的Northern Light等。就某一个具体的专业和主题而言,综合性搜索引擎未必比专业搜索引擎占有优势。

2.灵活运用“简单”和“高级”两种检索方式。在使用搜索引擎时,最令人头疼的找到的资料太多、太乱。一下子要面对由系统返回的成千上万个检索结果,如何从中迅速挑选出自己真正感兴趣的内容,是个不小的问题。

通常情况下,在选择好一个搜索引擎之后,可以先用简单检索,即在检索框中输入若干个关键词进行初步尝试,如果系统返回的检索结果比较多,则就需要通过高级检索来进一步提高检索的准确度、缩小搜索范围和过滤无关紧要的内容。一般而言,利用普通搜索引擎都能提供的高级检索功能、选择高级检索技术、通过灵活运用正确的检索表达式和特殊的操作符、限定词,往往可以收到事半功倍的效果。

3.不要在检索表达式中只使用一个关键词。一般人在使用搜索引擎时,总是习惯于在检索表达式中只键入一个关键词来进行检索,这将会导致很多无用的匹配结果。只要可能请尽量多选一些关键词,尤其是有明确定义的专业名词,因为对检索对象的描述越准确,检索的结果也越好。如药物名称、独特的产品名称、CAS登记号、地理位置以及人名等。

4.利用短语检索。为了提高查准率,许多搜索引擎都提供短语检索的功能。短语检索比较单词检索得出的检索结果相关性大得多。因此使用搜索引擎检索时,能用短语就尽量使用短语进行检索。当然,每种搜索引擎对短语检索规定的检索语法是不尽相同的。Inforseek、AltaVista、Excite均要求用双引号将短语括起,而Hotbot和Opentext则是让用户从下拉菜单中选择短语检索一栏。

5.利用字段检索。传统规范性文本信息的字段检索,一般是指限制在题目、作者、文摘、期刊名(会议名)、主题词等字段进行检索,而网络信息的不规范性导致对其进行字段划分就必须符合新的要求。目前搜索引擎提供的字段检索主要包括标题、URL、图像、链接、主机等。AltaVista、Inforseek和Opentext都支持字段检索。

6.同时打开多个检索窗口。利windows平台的多任务性,在检索时可以同时打开多个窗口,让不同的搜索引擎同时工作。

7.选择使用多元引擎查询工具。如不满足于一般的浏览,对检索结果有较高的要求时,可以使用多元搜索引擎。只要有足够的时间和耐心、通过多个搜索引擎的通力合作,总可以达到目的。

8.注意对检索结果的甄别。通常在搜索引擎反馈的检索结果中,与检索要求关联程度较高的内容总是安排在最前面,当来不及对检索结果全部浏览时,可先选择前面的内容阅读。

在搜索引擎反馈的结果中,经常会出现一些令人感到陌生的站点,请不要忽视这些名不见经传的网站和网页,它们当中很可能包含着一些专门从事某一领域或某一主题研究的专业网站,其专业资料之丰富往往令你目不暇接。

当搜索引擎反馈的结果或链接指针中有你感兴趣的网站或能使你为之一振的信息时,请及时将它们加入到浏览器的收藏夹或将它们马上打印出来,否则,在下一次检索过程中你可能再也碰不到它们了。

9、不要轻易放弃消失的网页和网站信息。有时点击搜索引擎中的检索结果,不能进一步得到网页,却得到404—Not Found”错误。这种问题有时候是由于整理网站,文件重新命名引起的。“404—Not Found”“无法找到该页”这种信息往往是由网页曾经呆过的那个服务器发出的,就是说该服务器很可能还在那里。如果能找到那个网页在该服务器上的新位置,就可以重新找到这个网页。例如,可以使用URL地址回溯的方法,把光标移到地址栏里网页文件名的最后面,然后往前删除文件名,在碰到第一个斜杠后停止,然后打回车键。重复此动作,直到你找到含有指向所删除文件的链接的菜单,或者到根目录为止。多数情况下,只要文件还在原来那个服务器上,在原来位置的附近小小地转一圈就有可能找到它。

网站有时会被迫迁移,新的地址无从得知,用回溯的方法就行不通了。可以试试搜索所寻找文件的标题或者作者的名字。具体地说,选择使用双引号把检索词组括起来的词组检索方法,或者使用title的字段检索方法。

除了上述方法之外,还有两个地方有可能找到“消失”的网页。一是Google和“百度”的网页快照,它们对数据库中的所有网页准备了一份备份。即使要找的网页链接不上了,也点击“网页快照”查看“原貌”。二是Alexa(http://www.alexa.com),它提供了一个能显示相关网页链接的工具条,当浏览器显示“Not Found”信息时,可以点击Alexa窗口上的“archive”链接,查看该网页的备份。

10.追踪、利用各搜索引擎推出的新功能。为了最大限度地满足人们对网络信息检索的效果要求,各搜索引擎除了在数据库收录范围、数据库规模上不断增加、扩大之外,检索软件也一直在改进、完善,不断推出新的功能。因此,追踪了解主要搜索引擎新近推出的检索功能,无疑将有助于检索效果的提高。如:Web第一个以关键词索引的Lycos新推出的全布尔逻辑检索(full Boolean search)和模糊检索(proximity searching),尤其是模糊检索,对于控制检索词的位置关系是非常有用的。AltaVista在原有提供短语和字段检索的基础上,又新推出了Live Topcs功能。Live Topcs是一种对原有检索结果词语控制工具,如已进行了一次检索,还需进一步限制,可以打开相应的Live Topcs词语表,对它列出的与本次检索相关的词语进行选择,可以进一步添加(相当于and检索)和排除(相当于and not检索)。这种功能的推出,多多少少弥补了至今网络搜索引擎均不能像DIALOG等一样进行检索集组配的缺憾。又如,Excite新推出的Excite Channels功能,按照主题列出了14个查询通道,实际上使得Excite更像是一个搜索引擎和主题指南的结合体,可以充分体现主题指南和搜索引擎各自的优势。

11不要拒绝“帮助”。一般的搜索引擎都提供“在线帮助”(Online Help)和“常见问题解答”(FAQ),请不要拒绝帮助,尤其是初次接触一个新的搜索引擎时,先花几分钟的时间熟悉一下它的特性,浏览一遍它的“Help”和“FAQ”,充分地了解引擎的操作、运算符和使用规则。特别在使用布尔算符时要注意操作符的操作顺序并遵循某些通用规则。

12.如果希望扩大检索结果的范围,可以采用以下手段:

A:检查使用的检索词拼写是否正确;

B:考虑增加同义词和近义词;

关于汉语检索词语的切分、删除、替换、聚类、补充、增加、组合等相关知识请参见本书第五章第一节的“聚类组合法”。

C:使用其他引擎、多元搜索引擎以及使用概念检索和相似页检索等。

在因特网上要迅速准确地找到自己所需的信息资源,很大程度上取决于对网络搜索引擎掌握的熟练程度。只有熟悉名引擎的搜索方法和特点,用户才能灵活地运用各种检索策略,根据自己的检索要求正确地组合各种搜索技术,在因特网上迅速地查询到自己需要的信息资源。

——选自林运卓编著《中小学教师信息检索与利用技能》(暨南大学出版社)

 图书馆利用法     anabull1.gif (2533 字节)向上返回页首     >>>网站推荐