互联网上除一般网页外,还如PDF、DOC、RTF、xls、PPT(S)等的文档文件,虽然这些文件不象HTM文件那样多,但这些文件通常会包含一些别处没有的重要资料,因此具有独特的价值和吸引力!所以对网络中这部分资源的挖掘和利用也是搜索引擎的一个重要功能。对网络的这部分资源的挖掘和分析的水平也成了衡量一个搜索引擎完整与否,成熟与否的重要指标。多文档搜索是高级搜索的重要内容,与其他高级搜索功能一起,构成高级搜索功能体系。
我们就一些搜索案例的比较来给大家展示一些网络文档搜索的技巧,并对主要提供文档搜索的搜索引擎百度和Google做一比较,这些比较和方法也许会对你进一步准确获得你想要的信息有帮助!
主要比较文档数量,语法使用的灵活性,准确性,多语法混合使用等等。
文档数量比较:
其他参数比较:
一搜也提供文档搜索,目前支持的文件类型不多,文档的数量也不够(或者可检出的数量不够),而且使用习惯与其他的不同(google,altaVista,alltheweb等)所以不列入比较范围。
总体评价:百度多文档搜索无论从搜索的质量和数量都是要与google相当,甚至超出google,说明,中文搜索引擎在应用的深层次挖掘上已经不再落后于外来服务商。我们有理由相信百度会提供更多更好的功能!
(出处:http://www.sheup.com)