Archive for March, 2009
March 30th, 2009 by 张磊
本来打算给我放在扬州电信的独立服务器续费的,但是上周我服务器居然毫无征兆地被关了。之后才知道是我写的这篇《可怜的大学生》被盯上了。在我保证会删掉文章后,服务器才重新被打开。自从要严打没有备案的网站以来,我关掉了自己所有没备案的网站,但还是三天两头被折腾。我知道这不能怪IDC,只好决定把网站“搬回”美国。
我选择了Linode的VPS,540Plan,迁移成功后网速和服务器速度都非常快。我也把那篇被迫隐藏的文章没做任何修改再次打开,大家可以看看,我不觉得自己的文章有什么问题。作为一个共产党员,不隐瞒自己的观点,我要向折腾我的傻B说:有本事来关我的服务器吧,要是您关不掉,动用GFW也成。
发牢骚完毕,我简单说一下迁移到Linode的过程;如果你熟悉linux,我估计从购买Linode到blog迁移完成甚至不会花掉1个小时。
先到Linode首页,右上方有个“Sign Up”的链接。注册需要填写信用卡信息,并且选择一个Plan,如果只是个blog,每月$19.95的360 Plan已经足够用了。提交后就会提示要刷掉多少多少美金,再下一步,账户已经创建成功并被激活,当然,相应的美金也被刷掉了。
之后登录进入DashBoard,需要选择Linode放置的机房。我选了fremont,据说速度非常快。之后会进入“Distro Wizard”。这个向导非常简洁,选择好想要的Linux发行版(我选了Ubuntu 8.10),设置了内存、Swap和硬盘的大小,最后给root设置个密码,点“create profile”,系统就配置好了。

回到DashBoard,会看到已经配置好的Profile,点“boot”。稍等片刻系统启动后,用root用户和刚才设置的密码连一下ssh,应该可以连上了。

完成以上的步骤最多15分钟。之后可以开始安装必要的软件。在ubuntu下用apt-get很方便,LAMP可以全用apt-get就装好。正如我开头说的,如果只是迁移一个blog,甚至不会花掉一个小时。
Fremont机房的速度很快,我特地装了一个测试速度的工具。测试结果如下:

把上面的数字除以8,就是我们通常意义上的KB/s了。如果大家有兴趣,可以在这里测一下到我Linode的速度。
March 29th, 2009 by 张磊
本周,几家国内的互联网巨头几乎都有露脸。
1、网易低调推出“网易宝”
与年初高调推出有道购物搜索不同,“网易宝”的推出极为低调。根据网易宝的官方介绍, 网易宝目前的使用范围仅限于网易旗下的藏宝阁和交友中心两大平台,但网易的显然不只有这点儿野心。不过,有10家支付企业刚拿到电子支付牌照,网易宝咋办?
写本文时候搜了一下“网易宝”,发现即使在网易自家的有道上,网易宝也没有出现在结果的第一页。
BTW,国内叫“*宝”的第三方支付真不少,还是支付宝这个名字最正点。
相关链接:http://www.techweb.com.cn/news/2009-03-26/396342.shtml
2、拍拍低调推出B2C
距离淘宝商城上线有些日子了,拍拍本周也推出了B2C商城。不过拍拍B2C的路线和淘宝有区别:B2C部分被叫做“品牌专区”。看来是瞅准了淘宝的软肋准备予以痛击了。据说在腾讯做拍拍的同志们会比较郁闷,不知道做有啊会怎么样。
相关链接:http://brand.paipai.com/index/index.shtml
3、支付宝商家频道改版
近期,支付宝的商家频道也进行了大改版,原来的wow.alipay.com只有几个静态页面,如今打开让人觉得恍若进了淘宝。支付宝正在努力加强与外部商家的协作,这也是一块可以快速成长领域。
不过,新版商家频道有不少瑕疵:
首先,没有favicon。Fenng曾说,“有的时候,判断独立域名的 Blog 是否专业,基本看一下是否有 favicon.ico 就差不多了”。对个人blog都是如此,更别说一个精心打造的网站了。
其次,页面很大,首页打开光图片就超过了1M。要知道,即使是淘宝首页,empty cache时也只有500k。不是@alipay说刚做过前端优化嘛?
最后,有个XSS漏洞,大家发现了么?
相关链接:http://wow.alipay.com/
4、百度贴吧改版遭抵制,李彦宏出面道歉
本周,百度贴吧短暂地换上了新版,但用户不买账,甚至发起了万人签名的反对活动。之后李彦宏出面,并声明:
看了很多大家对新版贴吧的评论和意见,我们会认真对待,坚决改正!
随后,百度贴吧换上了旧版。
这件事让我想起淘宝前阵子的改版,似乎并没有人道歉,用户抵制的声音也慢慢听不到了。两相比较,淘宝的做法有效仿国家宣传部门的嫌疑:拖、堵、删、等。
相关链接:http://blog.it.sohu.com/baidu/archives/239
5、Pixazza惹关注
Pixazza虽然名字难读,但最近开始被人关注,它甚至得到了Google的投资。Pixazza并不是一个网站,而是让网站上面的所有照片,都变成了商品展示架,于是被媒体称为Google AdSense for Images。但,在公开的信息中,Pixazza是以CPA/CPS的方式而非CPC方式获得收益。
相关链接:http://pixazza.com/
http://blog.163.com/mr6cc/blog/static/77030627200922610502619/
6、Nutch发布1.0版
Nutch是一个基于Lucene的搜索引擎,已经有多年发展。本周终于发布了1.0版本。Fenng也为此写了篇文章。不过我没用过Nutch,倒是用过Lucene和Sphinx。
相关链接:http://lucene.apache.org/nutch/#23+March+2009+-+Apache+Nutch+1.0+Released
March 27th, 2009 by 张磊
已经决定把服务器换成Linux,我很快就在一台虚拟机上操练了起来。通过apt-get和gem能搞定大部分应用程序和ruby的库,但mmseg(分词算法)和Sphinx(搜索引擎)是需要编译安装的。在此我使用了coreseek提供的版本。
准备工作:
apt-get install python-dev make g++
下载并解压软件包不再赘述。首先编译安装mmseg:
./configure –prefix=/usr/local/mmseg
make
make install
我在make的过程中遇到两次错误,都提示“strncmp was not defined in the scope”。这时需要找到报错的文件,打开编辑,加入一行:#include “string.h”。搜索发现这个问题并不普遍,可能和使用的gcc版本有关。修改之后就编译通过了。
之后编译安装Sphinx:
./configure –prefix=/usr/local/coreseek –with-python –with-mysql –with-mmseg-includes=/usr/local/mmseg/include/mmseg –with-mmseg-libs=/usr/local/mmseg/lib/
make
make install
在make过程中也遇到两次错误,提示为“cannot convert int* to Py_ssize_t*”。经搜索发现只有在64-bit的Linux上编译时才会出现,解决方法也很简单:打开报错的文件,找到对应的行,把int pos = 0改为 Py_ssize_t pos = 0即可。一共需要修改两处,修改之后就可以安装成功了。
最后,再把/usr/local/coreseek/bin加入到PATH变量中,Sphinx的命令(indexer/searchd/search)就可以正常使用了,至此,安装完成。
UPDATE: make容易失败,谨记make clean。
March 26th, 2009 by 张磊
GoGrid是一个和Amazon EC2相似的云计算平台,近期注册就会赠送$50,用赠送的金额最长可以使用66天的GoGrid服务。所以我就注册体验了一下。
注册的过程就不细说了,需要有一张信用卡才能完成注册。之后登入到管理面板,如图所示:

左边是账单信息和可用IP的列表,右边就是我添加的服务器。感叹一下资本主义拿ip不当ip,我一注册就分配我10个,随便用。点中间的“ADD”就可以增加服务器,我增加了一台cloud storage server以及一台web/app server。控制面板的速度非常慢,操作时需要耐心。
服务器启动起来以后,可以用putty连上去(已经开始计费)。下图是我在putty上用wget下载文件的情景:

可以看到在服务器上下载时网速很快。不仅如此,从服务器单线程下载内容到本地,速度维持在100K/s(杭州电信);在北京的fire9测试时速度有140K/s,这样的速度我非常满意,用来提供国内用户访问应该没什么问题。
GoGrid还提供了开放API用来调节服务器数量,以及免费的load balancer、免费的10G存储空间、以及100% uptime保证,确实非常不错。但不足之处也很多,比如服务器启动后无法关闭,要停止计费只能把相应服务器删除;提供的服务器image还不够多;价格上比起ec2也丝毫没有优势。所以,GoGrid还任重道远。
作为总结,我认为GoGrid还不值得推荐。我已经决定买一台Linode,然后把国内服务器上的东西“搬回”国外。毕竟,一台linux服务器可以有更多折腾的余地。而如今这台托管在扬州电信的服务器4月到期,到时可以放在住处,玩Hadoop。
March 25th, 2009 by 张磊
这是一篇话题广告,各位且看之。
最近风声紧,没备案的网站挂掉一大堆。甚至我自己的网站备案了,放在国内的服务器都被折腾了好几回。许多人开始将服务器签往国外,但如何选择国外的服务器呢?这里有一家提供web hosting choice的网站可以做参考。我简单看了一下,国内用户比较多的几家hosting,除了dreamhost,其他都上了榜。难道dreamhost真的这么差?排第一的是我没听说过的justhost.com,为啥在国内没动静呢?
当然,webhostingchoice.com提供的都是些关于shared host比较,而shared host大多都有严重的overselling(就看每家都能提供unlimited storage & unlimited transfer,你觉得它们能不oversell嘛)。如果网站流量比较大,是得考虑使用VPS甚至dedicated server的,当然现在又有了新选择:cloud server。
明天,我将写一篇文章谈谈gogrid:一个类似amazon aws的云计算平台。今天晚上尝试了一下,很惊艳。
March 24th, 2009 by 张磊
Robbin写过一篇《监视Rails进程内存泄漏的技巧》,谈到了“如何监控rails进程的执行性能”。因为production.log文件已经记录了每一次请求执行的时间,所以通过一些命令的组合,把需要的数据提取、排序、输出到文件就可以了。但windows服务器上没有这些命令(如grep, awk等),怎么办呢?这篇文章能给出个解决办法,虽然稍显复杂。
要在windows上拥有linux的命令,Cygwin是一个办法,但我总觉得安装Cygwin太麻烦,于是我找了UnxUtils。下载后解压,然后在环境变量PATH中增加UnxUtils/usr/wbin目录。常用的linux命令已经被移植到windows了,包括但不限于wget, g(un)zip, tail, grep。
robbin在文章中提到的组合命令是这样的:
grep “200 OK” production.log | awk ‘{print ”ALL: ” $3 ” View: ” $8 ” DB: ” $12 ” URL: ” $17 }‘ | sort -r | head -n 500 > timing.log
我们需要进行一些修改:
首先,UnxUtils没有提供awk,但有个替代品gawk。同时,在windows上的gawk不能用形如’{…}’这样的参数格式,而只能用”{…}”(两边只能用双引号),相应地,内部的语句如果使用了双引号,就需要进行转义、
其次,UnxUtils没有提供sort命令,不过Windows提供了。但这里要稍作修改,把sort -r 改为sort /r。
修改之后就可以使用了,命令改为:
grep “200 OK” production.log | awk “{print \”ALL: \” $3 \” View: \” $8 \” DB: \” $12 \” URL: \” $17 }” | sort /r | head -n 500 > timing.log
如果想要更方便点,可以做一个批处理文件,在生成timing.log以后用记事本打开:
grep “200 OK” production.log | awk “{print \”ALL: \” $3 \” View: \” $8 \” DB: \” $12 \” URL: \” $17 }” | sort /r | head -n 500 > timing.log
notepad timing.log
将以上内容存为timing.bat即可。
这里其实还有个隐藏的问题,sort命令默认是按照字符串来排序,所以9.1会排在11.1的前面,实际上耗时11.1秒的请求是更耗时的。在linux上,在使用sort命令时增加一个-n参数,就可以以数字来排序。但在windows上,我还没找到合适的解决方法。
March 23rd, 2009 by 张磊
今天收到一封来自阿里妈妈的广告邮件,标题是:“淘客必看!推广成交突破口!”(细心点能注意到,标题里两个感叹号,一个是中文感叹号,另一个是英文的,这种粗心,且按下不表)。邮件部分内容摘抄如下:
小二经过2天的精心整理,公布一批对淘客们有指导性的数据,包括精品卖家库,热门关键字Top20以及一周内的热卖单品……
精品卖家库的优势:
1.信用等级皆为钻级,服务质量高于冠级
2.店铺好评率皆在99%以上,信誉保证
……
看到了吧:信用等级皆为钻级,服务质量高于冠级。也就是说,淘宝认为钻石卖家的服务质量是比皇冠卖家高的,并公然向淘宝的用户推荐这一观点。淘宝的钻石卖家们,以后可以不用打出冲皇冠的口号促销了,淘宝自己都说了:皇冠还不如钻石呢。
我相信淘宝是“不小心说了真话”,店大欺客的事总在皇冠卖家身上发生。子宁前阵子在一家皇冠店买了一款E71,发来的手机没问题,但配件被做了手脚。后来只好协商退货,卖家一再坚持开掉的发票不能退,后来又咬死了没给他把发票寄回去,真是恬不知耻啊。
对了,卖家的店铺在这里,旺旺名叫“迅捷手机”,是一家十足的黑店。我会考虑帮这他家好好SEO一下。
March 22nd, 2009 by 张磊
看看这周的IT大事:
1、IBM洽购SUN
据国外媒体报道,知情人士表示,IBM正在与Sun进行谈判,准备收购后者,收购金额可能超65亿美元,以加强IBM在网络、软件、金融和电信市场的业务。
绝对的大新闻。而且从后续消息看,此次收购很可能成功。如果成功了,大家最担心的,可能就是MySQL了。
相关链接:http://tech.sina.com.cn/it/2009-03-18/15582921166.shtml
2、微软前高管转做歌手
现年58岁的吉姆·阿尔琴(Jim Allchin)曾是微软董事会共同主席,平台与服务部总裁,Windows掌门人,2007年初从微软离职,转行做了摇滚歌手,2月下旬他推出了首张唱片《Enigma》。
个人认为,如果不是非常热爱,绝对犯不着这么大年纪从微软离职去做歌手。当然,人家肯定不差钱,出唱片即使卖不出去也无所谓。等哪天虾米网发达了,没准南瓜同学也出张专辑?
相关链接:http://tech.sina.com.cn/it/2009-03-22/10412931393.shtml
3、Google首席视觉设计师离职,引发大范围讨论
据国外媒体报道,谷歌首席视觉设计师道格·鲍曼(Doug Bowman)今日离职。其原因在于鲍曼认为该公司过于痴迷数据。
引用该牛人的一段话:
谷歌的某个团队决定不了使用哪种蓝色背景的话,他们会测试41种蓝色区间的阴影,以判断哪种更好。我最近卷入了一场边框应是3、4或5像素宽的讨论,高层 要我用数据证明。在这种氛围下,我无法工作。我越来越对讨论这种芝麻大的设计决策感到厌恶。世上还有更多的、令人兴奋的设计问题需要解决。
设计师觉得无聊是有道理的,按工程师思维用数据说话也无可厚非。就像是泼墨山水和静物写生,很难说哪个更好。
相关链接:http://it.sohu.com/20090321/n262922701.shtml
4、微软发布IE8,各方褒贬不一
微软的IE8正式版已经发布,但是各方的反应差别很大。月光说,IE8体积庞大,经常崩溃,使用过程堪称噩梦。但也有一些支持IE8的声音。我极度怀疑微软没有进行完善的测试。
话说回来,自Vista和IE7双双失败,微软推出产品的手段已经做出变化。IE8正式发布之前曾经有测试版,Windows7也泄露出多个测试版本,采取这种态度显然要比闭门造车好。
相关链接:http://cd.qq.com/a/20090320/000294.htm
———————
插播广告:我将在本月底到北京,并在北京大约工作两个月时间。我来啦。
March 20th, 2009 by 张磊
几个月来第一则话题广告。今天写的是一家提供Fast Cash Loans的网站。不知为何,在写本文时该链接没法访问。
金融危机里面,很多这类提供短期贷款的网站都在ReviewMe上发布话题广告,也许真的是它们扩张的机会。不过今天这家提供短期贷款是有条件的:需要有一份全职工作(full time job),而且月收入必须超过$1, 500——暗自汗一把,俺的薪水还没有达到这个水平。在国内来说,每月能有超过$1500薪水的人,估计也不会缺钱吧。
搜索了一下,在国内,提供个人贷款业务的机构(除了银行)。但我觉得在各方面的监管下,会很难维持,遑论扩张。
March 19th, 2009 by 张磊
中午时候,智勇发来短信:
上午11点产一子,5斤5两,现母子平安,啊哈哈哈哈!
恭喜。
2007年我在北京,得到了智勇夫妇的许多照顾,顺便还认识了子宁。
2007年以前,我在buyren.net学到了许多东西,至今受用。
下周我就要去北京了,不知啥时候可以看见他家的张嘟嘟。