谁将是下代搜索引擎标准
作者: 吴育玮 2001-09-25
www.yahoo.com、 www.Google.com,以上这些网站对电脑使用者来说,应该都不陌生,在网络上,搜索引擎是人们找资料时的最佳帮手;而搜索引擎,也从第一代的 YAHOO 等搜索引擎,进化到了第二代的Google。那么,谁是下一代的搜索引擎?下一代的搜索引擎又将包含那些功能呢?
剖析第一及第二代的搜索引擎
第一代的搜索引擎,如早期的YAHOO等,所使用的搜寻方法是这样子的:网页建构人可以将自己网站加入搜索引擎的资料库中,自行命名自己的网站,并用数行文字描述自己的网站;而在使用者键入搜索条件后,搜索引擎会找出和搜索条件一样或相近的网站名字或描述。换句话说,第一代的搜索引擎希望网页建构者自行决定可以代表自己的网站的词句,如【音乐和游戏的下载】或【模拟器之家】等。
第一代的搜索引擎最大的缺点,就是无法针对网页内容进行搜索。举例来说,如果一个网站的内容包含了【Java】,【认证考试】及少许的【Html教学】;但如果网页建构人在将该网站加入搜索引擎时,并未键入【HTML教学】,则该搜索引擎对【HTML教学】这个词句的搜索,将永远不会包含该网站。正因如此,第二代的搜索引擎便应运而生了。
第一次使用Google这个第二代搜索引擎的人,应该都会发出一声赞叹:为什么它可以找到那么多的资料呢?细心一点的人应该可以观察到,Google所搜索的,是网页的内容。没错,这就是第二代搜索引擎最强大的地方。=版权所有 软件 下载 学院 版权所有=
相对于第一代搜索引擎的‘由网页建构人自行键入资料’,第二代搜索引擎不需要键入任何资料;取而代之的,是由搜索引擎使用一个Robot 程式,让它在网络上颉取资料,并自动将取得的结果存入资料库中。这意思也就是说:如果你建立了一个网站,并将它公布在网络上;则Google的Robot 就随时有可能将你的网站及底下相连结的所有网页加入它的资料库中。因此,Google号称其资料库中有著十亿笔以上的资料,且其资料是会随时更新的。
写到这里,笔者已经把Google赞扬的太完美了。难道Google是零缺点的吗?答案当然是否定的。对一个使用者来说,最好的搜索引擎,就是可以把使用者想要的结果显示在第一或至少在第二页的搜索引擎;Google最大的缺点,就是它所搜索到的结果著实太多,以致使用者所真正想要的资料有时候无法很精确的被显示在前几页。因此,如何从如此庞大的资料量中很精确的找到正确的资料,就成为下一代搜索引擎的重要课题了。
预测下一代的搜索引擎
说了这么多第一代和第二代的搜索引擎,似乎还没说到这篇文章的重点。那么,下一代的搜索引擎应该具备那些条件呢?在下面,我将分别针对‘准确性’及‘功能性’两项对下一代的搜索引擎进行预测。
准确性:
不管对任何搜索引擎而言,准确性都是相当重要的一点。因此,下一代的搜索引擎绝对会对准确性做大幅度的改良。不过,要在现行架构下提高单次搜索结果的准确性,事实上是不太容易的事情;因此,我个人认为,必须对架构进行改良才行。其改良方向应该有著下列几点:
1.先将搜索结果分类后,再由使用者自行挑选相关的类别以进行浏览。‘北极光搜索引擎’可算是这类网站的代表。
2.由使用者的回馈提高搜索结果中某种类型网站的排名。举例来说,在我下了‘药物’这个搜索后,我可以得到相当多的搜索结果;这时,如果我针对一个内容主要是在谈‘摇头丸’的网站进行回馈的话,我会得到第二组结果,而这第二组的结果排名比较前面的,几乎都是和‘摇头丸’相关的网站。
功能性:
1.图片、音乐、及影像资料的搜索引擎。网络上的资料,大致可以分为几类:文字、图片、音乐、及影像;而搜索引擎的功能,当然也不只限于文字搜索而已。可以预见的是:下一代的搜索引擎,必须要具备初步的图片及多媒体资讯的搜索功能。
2.个人化的搜索引擎。以往的搜索引擎,都只能依据一定的规则进行查询;笔者认为,下一代的搜索引擎,必须具备初步的个人化功能。所谓‘搜索引擎的个人化’,就是将使用者的过往行为模式,列入该使用者下一次搜索的参考;如此一来,在搜索引擎‘学习’到使用者的行为模式后,理论上搜索引擎会越来越符合使用者的需求。当然,细节上的技术仍然有相当多需要讨论之处,但在本篇概念性文章中不予讨论。
总而言之,搜索引擎的改良,可以大幅度地造福使用者。希望这些还‘存活’著的搜索引擎能够再接再厉,替使用者创造一个更良好的使用环境,并间接的替自己创造额外的利润。 =版权所有 软件 下载 学院 版权所有=
(出处:http://www.sheup.com)