Archive for April, 2008
April 30th, 2008 by 张磊
2005年在blogger群里,就看到datou在推荐他的“糗事百科”。这样一个低成本搭建起来的网站,经过两年的积累,如今已经非常Hot。当然,我和子宁也是糗事百科的忠实读者。
昨天大头突然GT上找我,发给我糗事百科在淘宝的冠名权拍卖。 5位数的价格对我一个学生来说有点高,不过我可以帮忙广告一下。
关于暑期实习,又陷入了深深的不确定中。邮件联系了一下孙权大哥,情况还不太明朗。后来改了GT的签名,Fenng大哥和Y和都主动帮忙,感谢我的朋友们。虽然不确定,但从心里说,我从来都没有担心过找工作这件事。只是假如我坚持考研的话,还有必要到处找工作?
最近还是很紧张,事情需要一件件来做。不过看到blog的PR 又跳回3了,小小地开心了一下。
April 30th, 2008 by 张磊
昨天爬起来,收到了阿里妈妈的通知邮件,说牛扑的广告位卖出了。心里很惊讶,以前PV有将近2万的时候,广告位也没人问津。现在PV不到1000,居然有人买(价格一直没变化)。如果我是买家,估计也不会出手。
不过话说回来,放在以前,45元一周的价格是非常实惠的,因为那时牛扑一周的独立IP有8万左右,每千人访问成本很低。可为什么没有人买呢?我觉得是阿里妈妈在广告位呈现上面的问题,不能让真正廉价的广告位暴露出来。
不管怎样,能卖出去总是好的,可以拿卖广告位的钱来抵一部分话费了。阿里妈妈的重点还是在CPA,早就想发发牢骚,正好今天写写。
首先是“淘客”这个名字觉得不知所云。其实逛阿里妈妈,想赚点钱的大多都是站长;可是“淘客”这个名字太Q化了,阿里妈妈在“淘客”上倡导的是:“网站赚 博客赚 论坛赚 聊天赚”,而实际上就是一个带联盟ID的链接,会动脑筋的站长肯定会把这些都考虑到,把站长们都当傻瓜了(也许这也是对的?毕竟我做了很久的CPS,脑袋里有这个概念,也许一些站长没有呢?)。

第二再说说链接。每次想推荐个东西,都会到阿里妈妈那边搜索个半天,然后获得一个很长的链接。技术上这个没问题,订单成交之后我会得到佣金,但是制作链接的过程太辛苦。比如我想推荐卓越网的任何一本书,我都可以手动写出带有我的ID的地址。
http://www.amazon.cn/mn/detailApp?prodid=bkbk745943&eqifa|27290|1|424
支持自定义链接几乎是现在CPS精准营销的标准之一。只是阿里妈妈想做好这个也不容易,因为淘宝上的商品ID本身就是个很长的字串,而且由于卖家众多,并不是所有的商品都会参与到CPA中。淘宝商城的CPA出来之后,在这一点上可能会有所提升,更多讨论可以看我这篇文章。
第三就是订单状态的反馈做得不够。通过阿里妈妈在淘宝进行的交易,只有交易全部完成后才会在阿里妈妈的后台看到。严格来说这样不是一个合理的做CPA的方式,网站主无法在订单交易的过程中获知订单的状态,最终会让阿里妈妈的CPA停留在一个“玩意儿” 的阶段,而不是一个真正可以依赖的盈利点。比起之前的两个来,做好订单状态的反馈应该不是一件困难的事。
April 29th, 2008 by 张磊
叔叔的朋友过来杭州,联系说要见面。这个学期从来都没有去过市里,终于有了机会。
下午3点半出发,坐车加上打车花了一个多小时,到了市里又等了一个小时 ,终于找到了从千岛湖回来的叔叔。寒暄之后约我一起吃饭,我一听就懵了,因为还有太原市市长,忻州市市长这些领导们也在,连忙推掉了(每临大事总慌张)。
就这么回去实在不甘心,来一趟市区容易么。马上转进了延安路的美特斯邦威 。大概二十分钟就出来了,带着两件衬衫一件短裤。今年夏天可以安然度过了。
又站了一个小时公交车回到学校,找到了NSN(据说叫做诺基亚西门子杭州研究中心) 的宣讲会,听了后面的一段,喜欢HRMM的声音,不过觉得那几个杭电毕业加入NSN的学长有点矬,在台上发言,声音都在发抖。考虑投一份简历去NSN。
April 29th, 2008 by 张磊
前天去淘宝,看到首页上方有淘宝商城醒目的横幅广告。向来后知后觉,有人说淘宝商城都试运营了好久。不过可以确定的是,这么大规模的宣传攻势,还是第一次。
很多人说原来淘宝是C2C,现在也做B2C了。其实淘宝从一开始瞄准的就是零售市场,才不只是C2C。而如今对于电子商务的分类(参见《电子商务》),也早就把C2C和B2C分在一起——因为个人的生意,也可以算是Business。
我不喜欢mall.taobao.com这个域名,仔细想想,是因为当当网。当当的店中店用的是mall.dangdang.com,店里的东西都不便宜,而且不能用优惠券、也没有返点。后来当当曾尝试做C2C,灰头土脸地结束。
进去淘宝商城看了一下商品的情况,从数码家电到男女服饰,大多都是有牌子的。本身B2C平台上的商家就是招商找来的,估计没啥名气的淘宝也不要。那么我们可以分析一下,淘宝商城上线,会有些啥影响。
网络和品牌
有媒体这么说:“根据公司的发展宗旨,淘宝商城的重点就是帮助国内二三线品牌。比如,此前就成功制造了“贞水”、“韩至”这样的网络名牌,且让其产生了直接的经济效益。”
我没有听说过这俩牌子,不过还是相信淘宝商城可以帮助一些不太知名的品牌。但是国内更多的恐怕是些根本没有牌子在做代工的工厂。
“广东最富裕的城市东莞的2007年经济报告显示:连续十年保持增长的工业“更新改造”投资,首次出现6.4%的负增长。这意味着东莞的企业家在增加生产上已经开始收缩,对制造业未来信心不足。东莞是广东经济的放大镜。而广东是全国经济的放大镜。
近期,海关总署公布的数据显示,今年2月份,我国贸易顺差额为85.6亿美元,不到1月份的贸易顺差194.9亿美元的一半。而广东作为中国制造业的基地,产业发展大幅依赖出口,次贷危机影响最先表现出来。
既然出去的路充满泥泞和陷阱,出路或许就在国内贸易上。”
内贸可以批发或零售,阿里巴巴也许可以解决批发的问题,虽然阿里巴巴上的东西很少有牌子。零售会让无名厂商很尴尬,因为品牌的积累是个一个漫长而艰难的过程——很多人相信网络可以很好地化解这一矛盾。
通过网络培养品牌,PPG做到了, 跟风的Vancl这些也做到了,我最近做“挑战杯”也在照搬这个理念。但淘宝商城终究是卖东西赚钱,它的牌子是“淘宝”,没有品牌的产品,想卖出去很难。在我看来淘宝商城的出现,并不能真正解决那些无名厂商的品牌问题,他们还得另找出路。
阿里妈妈和CPS
虽然阿里妈妈总把按效果付费叫做CPA,我还是喜欢叫CPS。阿里妈妈刚出来时是广告位的交易,可是很快就推出了CPA,按照成交付费。那时淘宝上已经有8000万件商品。CPA的前景非常广阔,比起从头做广告位交易,几个旗下公司投钱带头买广告位,似乎容易得多。
但阿里妈妈的CPA情况做得实在不理想,可能一个原因是淘宝虽然有那么多的商品,但也有许许多多不同的卖家,想把他们整合起来一起参与到CPA是个浩大工程。而阿里妈妈很多思路上和细节的问题也没有解决,现在我参与卓越和当当这些的联盟每个月都有4位数收入,可是阿里妈妈的CPA只做成过两个订单。
关于阿里妈妈的问题以后再说,淘宝商城的上线,确实也许真的成了阿里妈妈的机会。不是那么多卖家难以整合么,淘宝商城相当于一个超级大卖家。如果淘宝商城做一个网站联盟出来(这几乎是肯定的事),对于阿里妈妈来说将是很大的机会。它只要好好改进下现有的一些流程和环节使得对站长更友好,谁不愿意通过阿里妈妈赚钱呢?
如果上面的假设成立,那么另一个问题随之而来。
网站联盟,开放还是封闭?
众所周知,卓越、当当这些成熟的B2C网站,都有完备的网站联盟。大大小小的广告联盟(亿起发、linktech一大堆)也参与到其中, 每个广告联盟都有一定数量的站长,于是给卓越、当当带来了大量的订单(当然,还没到发挥出长尾效应的阶段,说明还有大潜力可挖)。
有着阿里的影响力,淘宝商城应该算得上卓越、当当的对手。阿里自己有一个广告联盟阿里妈妈,网站联盟上线肯定会开放给阿里妈妈来做。那么,是不是也会开放给别的广告联盟呢?
开放,等于培养给其他广告联盟送钱,养肥自己的竞争对手。不开放,难以利用那些广告联盟的资源,在这方面会输给卓越当当。更重要的是,如果淘宝商城做的CPS有一定起色,把成功的经验用在淘宝的海量商品上,那将是一件很恐怖的事。所以开放还是封闭,这里面的博弈,委实复杂。
April 28th, 2008 by 张磊
看到Google的开发者日出来,马上就去申请了,很长时间都没有回复,估计是被拒绝了。嗯,还是实力不够,不过Google也该发一封信告知一下吧。还好下午得到toti的帮助,从nffish那边拿到了一个邀请码。之后又厚脸皮自己发信给nffish,为子宁也要了一个。
Google的开发者日安排在了6月12日,正好是我20岁生日,看这情况,要过在北京了。我比较感兴趣的内容是MapAPI和Opensocial。不过最关注的还是最近出来的appengine,可惜没有时间动手尝试下appengine。
另一个就是阿里巴巴今年的网络工程师大会,是在5月24日。去年是Fenng大哥帮我弄的入场券,而今年申请的过程似乎容易好多,都不需要审核(怪哉)。分会场我选择了大型可伸缩系统,不知道能不能有收获。
一个问题是最近视力下降很严重,不知道到时在会场上能不能看清楚PPT。
April 28th, 2008 by 张磊
niupu缓存策略的使用上,为了省力用了Zend_Cache中的PageCache。而使用PageCache时,对于不同的登录用户,可能有一些细节是不一样,所以选择了“cache_with_cookie”和”make_id_with_cookie”。这样的话,程序会先对cookie数组进行序列化,将其转化为字符串,然后与REQUEST_URI拼接,最后计算md5散列值。计算得到的结果就是这个PageCache的ID。
对于一般的爬虫们发起的请求,自然是不带有Cookie的,也可以容易地使用缓存。但通过Firefox打开网站,在使用帐户登录以前,我也以为是不带有Cookie、可以使用缓存的。但实际情况是一直都不能成功使用缓存,以为是个案,所以没有管。直到前些日子用了memcached,又忍不住开工调试。
最后发现是cookie中的 AJSTAT_ok_times和AJSTAT_ok_pages在捣乱。在我没做任何设置时,这两个值就随着我访问网站出现在cookie列表里。我仔细搜索也没找到关于这两兄弟的细节,比如为啥会自己出现在cookie中。不过我猜测ok_times应该是记录访问这个网站的次数,ok_pages用来记录访问的页数,不知道是不是正确。
找到了问题,就可以有针对性地做出修改了。比较好的办法是写一个新的类继承原有的类,然后重写一下make_id这个函数。不过我就直接改了Zend_Cache的源码。
在/Cache/Frontend/Page.php中,有个叫“_makePartialId”的函数,找到包含case = “Cookie”的一节,其中有一句:
$var = $_COOKIE;
改成
$var = array($_COOKIE['info1'],$_COOKIE['info2']…);
原理就是用一个类似filter 的东西把有效的Cookie信息进行重新打包成一个数组。这样就不会把那些没用的Cookie信息也一并序列化了。
虽然问题解决了,可是还是没弄明白 AJSTAT_ok_times和AJSTAT_ok_pages到底是怎么生出来的。
April 27th, 2008 by 张磊
As I mentioned before, RMMSeg is a great tool to analyze Chinese contents. Today I did some test, only for fun.
To install RMMSeg, just type in shell:
gem install rmmseg
Or, it you get the “uninitialized constant Gem::GemRunner (NameError)” error, try:
gem1.8 install rmmseg
Once finished, we can easily call the powerful analyzer like this:
root@:~# echo “我爱北京天安门” | rmmseg
我爱 北京 天安门
root@:~# echo “blogkid爱北京天安门” | rmmseg
blogkid 爱 北京 天安门
root@:~# echo “2005年进入杭州电子科技大学软件工程专业” | rmmseg
2005 年 进入 杭州 电子 科技 大学 软件 工程 专业
Hmmm, RMMSeg’s dictionary do not contain the word “软件工程” (so it was splitted to “软件” and “工程”), but we can add it by hand (Not recommended).
vim /path_to_ruby/gems/1.8/gems/rmmseg-0.1.6/data/words.dic
You’ll see a list of words. Just add “软件工程” as a new line, save and exit.
root@:~# echo “2005年进入杭州电子科技大学软件工程专业” | rmmseg
2005 年 进入 杭州 电子 科技 大学 软件工程 专业
Now the whole “软件工程” comes.
Thanks to pluskid.
April 27th, 2008 by 张磊
很多时候需要监控服务器上的Memcached运行情况,比如缓存的查询次数,命中率之类的。但找到的那个memcached-tool是linux下用perl写的,我也没试过windows能不能用。后来发现个简单的办法可以做到,就是使用Telnet。
首先登录到服务器,然后在cmd命令行中键入
telnet 127.0.0.1 11211
其中127.0.0.1是服务器的地址(这里是本机) ,11211是memcached绑定的端口号。
之后命令行窗口全黑只有光标提示,摸黑输入stats,即可得到描述Memcached服务器运行情况的参数。如下图:

其中,uptime 是memcached运行的秒数,cmd_get是查询缓存的次数。这两个数据相除一下就能得到平均每秒请求缓存的次数——最近niupu的流量很低,所以平均也就一秒请求一次多,这么点大的压力,用文件系统缓存一样没问题,根本不会体现出使用memcached的优越。
下面的cmd_set 就是设置key=>value的次数。整个memcached是个大hash,用cmd_get没有找到的内容,就会调用一下cmd_set写进缓存里。紧跟着是get_hits,就是缓存命中的次数。缓存命中率 = get_hits/cmd_get * 100%。
下面的get_misses的数字加上get_hits应该等于cmd_get。而total_itemscurr_items表示现在在缓存中的键值对个数,在图上total_items == cmd_set == get_misses,不过当可用最大内存用光时,memcached就会删掉一些内容,上面的等式就不成立了。
话说回来,memcached要是能有一套完整的监测工具就太好了。memcached的安装和php相应配置请看这里。
April 26th, 2008 by 张磊
吃了popo一顿,回来继续写。
很多书都看过没什么印象了,不知道是处于张无忌没学会太极剑的时候,还是张无忌全忘记了太极剑的时候。
电子商务 原书第7版
因为子宁已经在我怂恿下买了这本书(虽然没有看),所以我昨天就没有写它。但这本书绝对值得看,作者既没有抛开市场谈技术,也没有一味地写营销、推广,而是全面地从多个方面来谈电子商务这档子事,我也曾把其中的一些章节独立出来作为Yellow沙龙的主题。
而且这书是英文的,读起来感觉不错。
想读的书:
投资学
早就买下来了,一直没有读,主要是没时间同时读很多英文的书,毕竟知识接受起来还没中午那么自然。 和找《宏观经济学》一样,投资学的书太多了,我挑了一本评价不错的老外的书,只是不知道效果如何。
晚上很high,有不少topic来不及写了。先存在脑子里,慢慢发
。
April 25th, 2008 by 张磊
今天是popo的生日,明天Yellow又可以和众多MM共进晚餐。每次大家都很high,尤其不能少了喝高的alone。看了刘德华演的《见龙卸甲》,深刻地意识到我们的周围太缺少异性,于是alone和鲶鱼依然光棍。
生日快乐。