February 3rd, 2008 by 张磊
早就想写了。几乎所有搜索引擎都会给出相关搜索的建议,比如在你搜胡紫薇时下面给个链接让你搜张斌。而这些相关内容,搜索引擎是怎么做到这个的,从这篇谈贝叶斯的文章里可以看个大概。 姑且把搜索引擎判断相关性的算法看成个黑盒吧,再高明的算法也需要数据的。数据从哪里来?在看流量统计时,有的访问者来自类似于这样的地址(把多余的参数去掉了): http://www.baidu.com/s?bs=%BA%FA%D7%CF%DE%B1&wd=%D5%C5%B1%F3 其实这个地址是我在百度先搜胡紫薇再搜张斌形成的,可以看到,这个URL(不知道叫URL是否准确)里有两个参数。其中wd参数,是进行搜索的词,在这里是“张斌”。而bs呢,解码之后是“胡紫薇”,也就是说,百度用bs这个参数记录下了之前一次搜索用的关键词。 那么,记录下来用来做什么呢?如果没什么用岂不是徒增烦恼?有一个解释,那就是用这个作为计算相关关键词的数据。到这里就该明白了,通过这样的联系,确实能让百度找出相关的关键词。 知道了这些我们能做什么呢?我觉得可以从两个方面看。首先,相关关键词能说明网民“也会这么搜”。对于做关键词优化的网站,如果围绕着热门关键词来做觉得困难,可以考虑这些相关的关键词。第二,上面的那个链接,也许是个突破口。如果你的网站某个关键词在百度排名很靠前,可以利用上面那个链接“刷”一下,把这个关键词和某个热门关键词绑在一起,这样当热门关键词被搜索时,你刷的关键词会出现在相关搜索里——这个方法,估计不少人在用呢,只是不说出来吧。 这么看来Google就有点神秘兮兮,他是怎么获得相关性的数据呢?难道先把某个人的搜索记录存成日志再到日志里去计算?
January 25th, 2008 by 张磊
相信很多人都读过长尾理论,确实是本好书,我还在放假前把我的那本送给了一个朋友。最近又看到一个长鼻子曲线,有点新颖也挺有道理。最近看到我的blog流量突然涨起来,全是因为一个关键词——胡紫薇。 仔细地分析下。这事已过去有将近一个月,为了看看这个关键词的被关注程度,我特地到百度指数中查了一下。得到了下面的图: 可以看到,29号张斌同志东窗事发时,用户关注度一下从零升到八万多,紧接着一个低谷是元旦的三天假期,上网人少,可以理解。假期结束,关注度重新提高,并且每周末会有个小低谷,但总体是在不断下降。最近的用户关注度,在5000多。 也就是说,平均每天在百度搜索“胡紫薇”的人,现在是一个月前的1/16。 另一方面,从我blog来看,我在知道这事以后,第一时间写了篇文章——奥运会,胡紫薇。说实话,当时心里并没有什么追逐热门的想法,只是发表了下自己的意见。 紧接着的几天,因为有很多媒体在关注(看看上图的媒体关注度就知道了),我的文章很难被搜索到。排在Google的第5页,但因为搜索的人多,每天还是能有10多个独立IP。过一段时间,到了第六页,能获得的IP更少了。百度一直没有动静。 后来有一个MSN SPACE的用户转载过我的文章,看她的SPACE,应该是个MM。我自己也在文章里引用过几次这篇文章。 一月之后,形势就突然变化了。昨天开始,百度把这篇文章排到了搜索结果首页第9个,虽然是第9个,但昨天一共带来了202IP,而Google只带来了1个IP。 长长的鼻子,鼻梁终于在1个月之后出现了。其实道理也很简单,最近在读魔鬼投资学,里面在阐述这样一个观点:理性地用期望的方法来作出决策。简单地说,比如一支股票涨的可能性有70%,涨幅为0.2元,而跌的可能性有30%,跌幅为1元。这样说来期望就是0.2*0.7-0.3*1 = -0.16,显然,买入不是个好主意。在SEO里,虽然每天搜索这个关键词的次数在不断变少,但是随着时间推移,一个优秀的网页可以获得更多的外链,得到越来越高的权重。经过积累,最后还是可以形成可观的流量。 所以得耐心,特别是在针对百度的优化上,其变化通常很难预测。最好就是好好做内容,别用什么伎俩。