搜索进阶
无论常规还是专用的搜索引擎,大多数都提供了替代的网页搜索方法。在打开的网页上,目录列表和搜索栏都是标准的功能。你可以找到高级搜索选项的链接,以便定义、限制或者扩展搜索条件。许多搜索引擎甚至会在帮助文件中指导你完成搜索过程。
对于支持布尔条件的搜索引擎,可以使用布尔条件最快捷地完成输入;也可以使用专门的搜索窗体完成输入。
窗体使用了转换成英语的布尔条件;另外,通过窗体也许还能够启用过滤器,例如替代字符或者通配符(比如搜索color*可以得到color、colors和colored)。
此外,你还可以精简搜索结果或者把结果按特定的格式显示。例如,AlltheWeb的高级定制首选项能让你使用查询重写,通过重新改进查询来改善搜索结果;此外高级定制首选项中还可设定自动完成(给出完成部分搜索短语的建议)和新闻集成。Google的高级搜索功能可以很方便地用来操控字词、域/网站、语言和文本控制过滤。
排除法
必要时你可以排除一些词。如果你眼前充斥了无关的结果,可以花一点儿时间看看不符合要求的结果并找到一个可以从中排除的共用关键词,排除该关键词后就可以进一步限制搜索结果。许多搜索引擎都允许排除特定的结果:一些搜索引擎是通过高级搜索界面或者布尔语言,另外一些搜索引擎是通过一些很简单的方法—比如在要排除的每个关键词前面放一个减号。处理这个问题的方法有多种,因此你必须做一点儿核查工作。
别盯住一个结果不放
几乎有三分之一的搜索引擎都是单个词的搜索。虽然搜索引擎在处理多个单词搜索方面已经聪明多了,但是一般还是会把最流行的内容放在最前面。对于模糊的主题这可能是个合理的策略,但是没有几个引擎可以返回满意的搜索结果。
在测试中,我们在每个搜索引擎上都使用的一个单个词搜索就是寻找叫做Godiva的巧克力。但是如果你要找的是Lady Godiva的原盎格鲁-萨克逊名字该怎么办?在Google中输入Godiva找到的结果基本上都是巧克力的,但是多敲几个字母输入Lady Godiva的话,结果就找到答案了(Godgifu)。
在进行单个词查询时,因不同的单词而异,你也许会找到数百个或者几十万个结果(也许更多)。虽然增加几个关键词不一定会把结果限定在你方便浏览的范围内,但是很可能会把较相关的结果放在最前面。
了解自己使用的搜索引擎 =版权所有 软件 下载 学院 版权所有=
每个搜索引擎都有输入搜索条件的文本框。而且,几乎每个引擎都有许多功能和独特的特点。一旦选择了某个搜索引擎,你就应当花一些时间阅读一下帮助页面并检查它的高级搜索功能、搜索结果精简功能和所有其他的高级用户功能。如果你的搜索可以按照引擎的某些规律进行,上述花费的时间很快就会得到回报。
即使在阅读了我们的评测之后你决定坚持使用一个经过试验觉得可靠的搜索引擎,也应当检查一下这些高级功能—如果你还没有这样做的话。在任何情况下,都要注意搜索引擎的新发展。比较好的引擎总是会不断地进行改善。
正确拼写
大体来说,搜索引擎都是遵循“无用输入、无用输出”的原则。它们搜索你输入的条件的准确拼写,因此如果搜索到的结果很奇怪,你一定要检查是否有拼写错误。
多种尝试
虽然Internet世界越来越相互关联,但并不意味着所有的搜索引擎都返回同样的结果。由于不同的搜索引擎使用不同的方法判断数据相关度,所以当你使用两种搜索引擎搜索同样的数据时,可能返回的结果也是不同的。当你没有找到所需的数据时,可以试试其它的搜索引擎。尽管只是多花费了一分钟时间,但是搜索结果将会令你满意。至少,你可以了解其它搜索引擎的变化。
错误拼写
Internet上充满了错误的拼写。在某些情况下,试试错误拼写的关键字也许是个不错的主意。但是,这取决于你使用的是哪种搜索引擎。搜索recombinant DAN(编注:正确的拼法是DNA)也许找不到你想用于遗传学学术研究论文的结果,但是搜索Avril Lavinge pix也许会满足你寻找通俗俚语的要求。
学习语言
只要知道布尔查询语言,就可以帮助你更准确地找到所需的内容。某些网站允许你在主搜索栏中使用布尔运算符,而另外一些网站则可能需要你点击高级搜索选项。
通过组合使用标准的布尔运算符AND(两个条件必须都出现)、OR(至少某一个条件必须出现)和NOT(后面的条件不许出现),总是可以改善搜索结果。
除了使用上述条件外,你还可以经常使用圆括号和引号为条件进行分组—就像是在数学方程式中一样。例如,如果你在搜索狄更斯的《大卫 ·科波菲尔》但是又记不起来作者的名字,就可以在搜索栏中输入“大卫·科波菲尔” AND书 NOT魔术师。
应该注意的是,尽管AND、OR和NOT是常见的布尔条件,但是许多搜索引擎都有自己的专用条件。例如,你可能在某个搜索引擎看到的是ANDNOT而不是NOT。某些搜索引擎确实提供了让你填写的布尔窗体,你需要在各个独立的文本栏中输入条件,再通过下拉菜单选择合适的布尔运算符把这些文本框连接起来。有关的专门规定,请查看每个网站的帮助文件。
把网撒得更大一些
如果你使用自己喜欢的搜索引擎并没有得到较好的结果,为什么不试试代理搜索工具?这个工具会从许多搜索引擎中得到一大堆结果。
坦白地说,代理搜索并不是我们喜欢的搜索方式。代理搜索引擎还没有经历过时间的考验(像常规搜索引擎那样),而且,由于堆积了来自许多搜索引擎的结果,通常只是在无用的界面中显示了太多的结果。更重要的是,代理搜索引擎一般不能把复杂的查询语言翻译成各个搜索网站需要的特定格式。
虽然总体来看各个搜索网站都在不断改善,但是还没有完美的网站,而且,没有一个网站能索引到整个Internet。因此,如果你的第一个和第二个字符串搜索网站都不能返回较好的结果,就可以试试代理搜索网站—例如Dogpile、IxQuick、MetaCrawler或Mamma.com,也可以试试代理搜索工具—例如Copernic (参见后文)。大家一般都不会认为HotBot是个代理搜索网站,因为HotBot有个很酷的界面,但是其中提供了一些类似于代理搜索的内容。你不必重复输入查询条件,只要点击一些单选钮即可获得在AlltheWeb、Google、Inktomi或Teoma中的搜索结果。
语言问题
如果你的搜索是针对某种语言的,如果你需要翻译,如果你想执行本地搜索,都有相应的工具可以使用。
许多搜索引擎(例如Google)允许你设定使用偏好,从而仅在所选的语言中进行搜索。另外,还有针对国家的搜索网站和过滤器,可以按语言和国家缩小搜索范围。
安全问题
虽然我们尽量不鼓励多疑狂,但是每个人都应当知道,和其他的Internet或计算机活动一样,搜索也会被跟踪。一个坚定的跟踪者可以从多种来源重新构建你的Web搜索。其中,一些来源(例如历史记录缓存)可以很容易地清除(虽然打败决意跟踪者需要的并不仅仅是清除缓存);而其他一些来源的跟踪线索清除却困难得多,例如公司的Web服务器日志(如果你在上班时进行搜索就会在日志中留下痕迹)、ISP的日志以及搜索引擎公司自己的日志。
图书馆还面临老问题的新的表现形式,那就是如何接受关于读者借阅习惯的执法调查—例如,当执法部门要求提供关于注册会员的计算机辅助搜索的信息时。在某些情况下,执法官员会查封图书馆的服务器。对于偶然进入图书馆的用户倒没有什么问题,因为图书馆不要求他们提供任何识别身份的信息。然而,对于使用密码远程登录的用户,可能就要考虑考虑自己会留下一些什么样的个人信息了。
钻得更深,看得更多
许多人认为自己使用的搜索引擎可以找到所有电子信息,这种想法是不对的。
有一大类页面根本就没有指向它们的链接,或者因为这些页面中包含有特殊的数据类型—例如图片、音乐和PDF文件,而蜘蛛程序和机器人程序都不会索引这种文件(尽管许多常规搜索引擎已经在这方面取得了一些进展)。正如大家所知,Deep Web的绝大多数都包含有蜘蛛程序无法索引的数据库。虽然蜘蛛程序可以读取数据库的地址,但是它不能解读数据库的内容,因为包含有价值信息的页面只是响应了数据库用户的查询而临时创建的。此外,许多数据库都要求提供用户ID和密码,加剧蜘蛛程序和机器人程序的工作复杂度。
有一些门户网站专门提供访问Deep Web的方法,通过它们可以找到和访问许多此类数据库。这些门户网站包括CompletePlanet (www.completeplanet.com)和InfoMine (http://infomine.UCr.edu)。
你可以试试我们列出的专用(或小型)搜索引擎,看看能找到什么内容,然后沿着找到的链接查找高质量的信息。=版权所有 软件 下载 学院 版权所有=
你找到的结果怎么样?
有一些神奇的工具可以在你搜索的结果中找到很多东西,反过来又会帮助你决定其价值。
[1] [2]
如果想知道搜索引擎所找到的网站的主人,可以使用WhoIs网站,例如www.whois.sc,或者使用更著名的www.whois.org。找到源头是个很有用的技巧—尤其是有关健康或财政信息方面的内容。另外,你也可以考虑付费的搜索机器人,例如BrightPlanet的DQM2 Deep Query Manager,它可以帮助你寻找、分类和管理信息。
(出处:http://www.sheup.com)