Loading...

Tag Archive for 'seo'

    AD: 猛买 | 快递查询 | Jobsdigg | 很棒的男装店

京东商城改版后

今天在京东上闲逛,突然想看一下新版的京东商城在SEO上有没啥亮点。没想到,我一翻源代码,居然看到这个: <title>     佳能(Canon)450D 数码单反相机套机(EF-S18-55/3.5-5.6IS镜头) 全国惊爆! 【行情 报价 价格 评测】 </title> <meta name=”description” content=”&lt;%=description %>” /></head> 查看一下页面信息,description是这个样子;没有keywords。看来网站很有可能还是用asp搭的。 有点儿失望呐。

近窥糗事百科改版

大头的糗事百科和秘密我都一直在关注,虽然看起来是很简单的两个网站,但流量不小,alexa如今都在8万左右。记忆中在05年大头就在推广他的糗事百科,如今子宁和我,都是忠实读者了。 糗事百科和秘密都是用rails搭建的,最近进行了一次升级。升级后我发现,原来是类似articles/view/1234的地址样式,如今已经变成了articles/1234.htm。这应该是为SEO做的考虑。关于一个网站的URL怎么设计,我曾推荐过一本书:Web2.0高级编程,这里面关于实现和维护URI地址空间有不少阐述。其实一个主要的出发点就是把URL看做资源,让它回归本质(URL中的R,就是Resource的意思),而不是把某个地址和php/java这些东西绑起来。基于此,形如article/view/1234的地址是被推荐的。 而现实中的情况往往相反,虽然搜索引擎不喜欢a.php?id=3这种地址,但对articles/view/1234的好感也很有限。以前我并不确定,但看到糗事百科的改版,肯定了自己的判断。还是什么都敌不过静态啊。 话说回来,豆瓣、曾经的V2EX还有其他的一些网站,链接格式是非常遵守规范的,没有向静态妥协。在SEO上,更重要的还是合理地链入链出。

闲话SEO

每天培训。今天忙里偷闲看看流量,居然比往日略多。排查发现是原因来自百度:往日从Google来的流量大概是来自百度的4倍,而今天变成了两倍。 我写blog三年,对SEO的态度算是关注但不注重。在05年到06年时整个网站都被百度封杀,我不知道是为什么,当然,也不知为什么不知不觉就被解封了。后来的大多数时候,百度来的流量是google的几倍,也算符合国内搜索引擎市场的格局。 而今年以来,百度来的流量在逐渐下降,可能因为我去掉了一个叫“All-in-one-SEO”的wordpress插件。这个插件主要能帮忙往每篇日志里加入类似keywords/description的Meta信息。我曾因为升级到WP2.5以后,嫌东西太多太麻烦就关掉了它,流量于是开始逐渐下滑。前些日子我又启用了这个“All-in-one-SEO”,如果非要说和seo相关的做过什么,也就是这个了。 难道这个英文的SEO插件,反而在百度身上起到了作用? 其实我一向对SEO没那么卖力,我的看法,如果能坚持按照标准来做事,按照标准来组织一个页面,合理地链入链出,已经是很好的优化了。其实很多人很多公司的网站,连这一点都难以做到。 从前向别人介绍自己,总忘不了说去搜索引擎搜索张磊,第一个就是我blog。如今只能说,去Google搜索张磊吧,第一个就是我blog。嘛时候在百度也能重回第一呢? 一则广告:Fenng作序的这本《Python源码剖析》,对python感兴趣的朋友们可以找来看看 。

How to get reindexed by Google

These days I’m working on a paper for the Challenge Cup, too busy to write a post. However, when I stop writing, some of my readers are curious to know where I am. So I decided to write this post, to talk about how to get back to Google’s index. 9 months ago, when I [...]

怎么也不行

重启到XP,写篇中文的。 微软求购雅虎是大事,百度封杀nicewords是小事。大事从来都没咱们的事,最近却为小事折腾了许久。 一个网站离开百度会很难生存。可如果离开Google,看起来影响没那么大。我的一个网站在每天有5000IP的时候,在Google的索引里还一个网页都没有。如果是Google封杀nicewords,也不会有多大反响,因为就算不封杀,用nicewords做起来的网站也排在第一百页。 话说回来,国内采集横行,和百度不无关系。奇怪的排名,给了采集站排在前面的机会,也把小站长们都培养成了投机者。同样的内容,豆瓣9点上的文章会排在我的blog前面。百度占着将近70%的搜索份额,哪怕再花大力气打击采集呢,只要算法没改,还是会有大量的采集。域名这么便宜,空间这么便宜,机会成本太低。 题目叫做怎么也不行,是看到邮箱里谷歌推出的大学生公益活动想到的。谷歌把QQ、Tom、新浪、天涯都拉来了,可是养着一群工程师成天做些无厘头的产品,怎么也不行。既然现在一切为了流量,谷歌哪个东西赶上百度知道或是百度贴吧的水平了?最近听说人要做正版音乐下载,日,如果正版在国内可以贯彻,咱们早就都用Ubuntu了。 还有就是通过采集来做的网站,大体来说,怎么也不行。尽管可以短期获得一定的流量甚至可以从Adsense得到些许收入,但这不是一个可以得到稳定收益的方式,因为这个过程没有价值——一不小心被封还会废了域名。怎样才有价值?我觉得产生价值是通过劳动或思考,把无序状态的东西变为有序的过程。比如花些时间拼好一个魔方。如果对采集情有独钟,可以看看智勇的这篇文章。

Recent good news of blogkid

Just found I prefer to write in English now, but I’m afraid not all my reader can well understand. Several good things happened in the recent tens of days, so I decided to write them down, and share my happiness with you all. Niupu’s traffic reached 7,000 ip/day. Niupu got online in April, 2007, however , there [...]

百度的相关搜索

早就想写了。几乎所有搜索引擎都会给出相关搜索的建议,比如在你搜胡紫薇时下面给个链接让你搜张斌。而这些相关内容,搜索引擎是怎么做到这个的,从这篇谈贝叶斯的文章里可以看个大概。 姑且把搜索引擎判断相关性的算法看成个黑盒吧,再高明的算法也需要数据的。数据从哪里来?在看流量统计时,有的访问者来自类似于这样的地址(把多余的参数去掉了): http://www.baidu.com/s?bs=%BA%FA%D7%CF%DE%B1&wd=%D5%C5%B1%F3 其实这个地址是我在百度先搜胡紫薇再搜张斌形成的,可以看到,这个URL(不知道叫URL是否准确)里有两个参数。其中wd参数,是进行搜索的词,在这里是“张斌”。而bs呢,解码之后是“胡紫薇”,也就是说,百度用bs这个参数记录下了之前一次搜索用的关键词。 那么,记录下来用来做什么呢?如果没什么用岂不是徒增烦恼?有一个解释,那就是用这个作为计算相关关键词的数据。到这里就该明白了,通过这样的联系,确实能让百度找出相关的关键词。 知道了这些我们能做什么呢?我觉得可以从两个方面看。首先,相关关键词能说明网民“也会这么搜”。对于做关键词优化的网站,如果围绕着热门关键词来做觉得困难,可以考虑这些相关的关键词。第二,上面的那个链接,也许是个突破口。如果你的网站某个关键词在百度排名很靠前,可以利用上面那个链接“刷”一下,把这个关键词和某个热门关键词绑在一起,这样当热门关键词被搜索时,你刷的关键词会出现在相关搜索里——这个方法,估计不少人在用呢,只是不说出来吧。 这么看来Google就有点神秘兮兮,他是怎么获得相关性的数据呢?难道先把某个人的搜索记录存成日志再到日志里去计算?

大饼

听一个在阿里的朋友说,那边想到做个啥产品,先要“画饼”。可爱。最近牛扑的流量有小涨,与之相伴的,是在eqifa业绩的提升。早就想拿那边的销售数据来统计一下,这下可以遂愿了。 我取了1月16日到1月25日10天的销售数据,总的销售量是5600多,如果按12%的佣金比例,就是56*12 = 672。用python写程序分析了一下那些订单数据,把得到的数据作了两个图。 上图是按照时间划分的每小时的订单数。可以看到21点和14点是订单量比较大的两段时间,而且上面排在前面的都没有早晨的,看来早上同志们都很忙碌阿。下午17点到22点都在上面,串起来看,可以说是网购的黄金时段了。 另一方面,没有上榜的17个小时(Other),彻底没有订单的有2点、4点、5点、7点,都在凌晨或是早上,比较正常。还剩13个小时,长尾初现,这部分时间里的订单数,超过了21点的订单数。 再看另一张图,是把订单统计改为商品个数统计。 上榜的名次有些改变,最突出的就是0点居然排在第二名。这个和样本容量比较小很有关系,在订单统计中,0点10天里只有2个订单,却包含了18件商品。总体来说,黄金时段并未改变。 这些天的订单们,平均每个订单的金额是79.6元。 对于金额的统计也做了,不过GoogleChart的API用起来很复杂,就不画饼了。销售金额的冠军依然在21点(黄金!黄金时段呐),为1418元;第二在0点,接近1000元;第三在22点,将近800元——这个数据,和上面蓝色的图更为吻合。 今天还学了一个为Python中Dictionary排序的办法: a = {‘a’:6,’b’:2,’c’:8} print sorted(a.items() , lambda(k,v) : (v,k)) 得到的结果会是一个list,里面每个元素是一个k,v对的Tuple。统计数据的程序可以一次写好多次使用,非常方便。当年看馒头做的buyren返点系统,觉得很高深,现在看看,只要深入去研究,还是很轻松的。

SEO中的长鼻子

相信很多人都读过长尾理论,确实是本好书,我还在放假前把我的那本送给了一个朋友。最近又看到一个长鼻子曲线,有点新颖也挺有道理。最近看到我的blog流量突然涨起来,全是因为一个关键词——胡紫薇。 仔细地分析下。这事已过去有将近一个月,为了看看这个关键词的被关注程度,我特地到百度指数中查了一下。得到了下面的图: 可以看到,29号张斌同志东窗事发时,用户关注度一下从零升到八万多,紧接着一个低谷是元旦的三天假期,上网人少,可以理解。假期结束,关注度重新提高,并且每周末会有个小低谷,但总体是在不断下降。最近的用户关注度,在5000多。 也就是说,平均每天在百度搜索“胡紫薇”的人,现在是一个月前的1/16。 另一方面,从我blog来看,我在知道这事以后,第一时间写了篇文章——奥运会,胡紫薇。说实话,当时心里并没有什么追逐热门的想法,只是发表了下自己的意见。 紧接着的几天,因为有很多媒体在关注(看看上图的媒体关注度就知道了),我的文章很难被搜索到。排在Google的第5页,但因为搜索的人多,每天还是能有10多个独立IP。过一段时间,到了第六页,能获得的IP更少了。百度一直没有动静。 后来有一个MSN SPACE的用户转载过我的文章,看她的SPACE,应该是个MM。我自己也在文章里引用过几次这篇文章。 一月之后,形势就突然变化了。昨天开始,百度把这篇文章排到了搜索结果首页第9个,虽然是第9个,但昨天一共带来了202IP,而Google只带来了1个IP。 长长的鼻子,鼻梁终于在1个月之后出现了。其实道理也很简单,最近在读魔鬼投资学,里面在阐述这样一个观点:理性地用期望的方法来作出决策。简单地说,比如一支股票涨的可能性有70%,涨幅为0.2元,而跌的可能性有30%,跌幅为1元。这样说来期望就是0.2*0.7-0.3*1 = -0.16,显然,买入不是个好主意。在SEO里,虽然每天搜索这个关键词的次数在不断变少,但是随着时间推移,一个优秀的网页可以获得更多的外链,得到越来越高的权重。经过积累,最后还是可以形成可观的流量。 所以得耐心,特别是在针对百度的优化上,其变化通常很难预测。最好就是好好做内容,别用什么伎俩。

刺马案

昨天给MM找《投名状》的原型,结果搜索结果第一页第一条,居然提示含有恶意软件。 2个问题: 被标注有恶意软件,不会降低PR?不然为何排到第一个? 列在第一个,却不让直接访问,Google想干啥 PS:前些日子写的“很黄很暴力”,算是追逐热门关键词。即使在Google排到5、6页,从这个关键词过来的流量,依然超过了其他可以排在第一页的关键词。