机房维护工作日志,利用日志维护TAG

利用日志维护TAG - 电脑网络 - 电脑教程网

利用日志维护TAG

日期:2007-04-17   荐:

作者相关:http://blog.sina.com.cn/icecofee

准确的说,就是利用日志中搜索引擎用户的到访统计分析来维护TAG。

TAG,可以用于活跃互动、计算内容类聚、在不能使用全文搜索的情况下用于用户关注度高的内容搜索,让一些时间比较久的历史热门内容仍然能被搜索引擎收录。

但从目前情况看,问题也是非常大的:1、除特定网站之外,用户对创建TAG 全无经验,导致用户创建的TAG 可利用性很差;2、按目前大部分网站的做法,TAG 的热度初次生长依赖网站编辑的经验,这样,初始位置好的TAG 可能获得较好的热度生长基础,不能真实反映TAG 的受欢迎情况。

可以使用这样的办法改进目前的TAG 维护方式:从日志提取搜索引擎用户使用的关键字作为TAG,并按搜索引擎用户到访的关键字热度来维护排行,特定TAG 下的内容排行也按搜索引擎用户按该TAG 到访情况排行,并使用与时间相关的算法让历史访问量衰减。

这样做的好处:1、降低了用户创建TAG 的技术要求,不需要用户创建TAG,功能更傻瓜化。2、TAG 关联的相关文章直接按搜索引擎用户使用关键字到访情况计算,使用的外部优化过的内容排行,很大程度降低服务器开销(很多小网站开销不起相关文章的运算)。3、TAG 热度排行准确性提高很多,使用搜索引擎用户到访的统计让排行对内部推荐的依赖程度降低。

实际上,利用外部搜索引擎降低网站服务器开销已经是很多网站都在采用的做法(有的web2.0 网站限于服务器条件,甚至连计数器都支持不好),比如说搜索直接指向外部搜索引擎网站。而本文做法,不仅能显着降低相关文章的索引开销,更重要的是,这种开销的降低不会影响网站被搜索引擎收录(网络推广),也不会影响用户访问的需要。

当然,这个方法也有一个问题,由于直接使用搜索引擎用户到访的排名来维护站内TAG 频道排名,热度排行的进化是一个加速进化过程,会导致访问量向热门内容倾斜的比例更大。一个改进的办法是在热门排行里适当插入热度低一层级的TAG 或内容,甚至直接将最热的十个(或二十个)TAG 及内容交换到次热位置。这样做的好处是可能能增加广告的点击率,最热门内容页面上用户过于关注内容,对广告可能熟视无睹,而冷门内容页面可能用户停留时间短,次热内容页上用户停留时间足够而无聊程度也足够,不过次热的标准要通过实践摸索。

标签: