Loading...

Tag Archive for 'js'

    AD: 猛买 | 快递查询 | Jobsdigg | 很棒的男装店

Google爬虫将支持JS?

最近频繁在流量统计里看到来自美国Google的IP,窃喜,难道有Google的人关注我blog?可是今天一下子就看到4个Google的IP,不会吧,我在Google有这么多Fans?后来想到这个可能性,Google的爬虫开始支持JS了。 我在流量统计的后台看到这几个访问者的客户端信息是:Windows XP, MSIE 6.0, 800×600, 224 色, 未安装 Alexa 工具条。若这些是真的,Google的人用的电脑也太差了吧,或者人家在手机上装了XP?怎么显示器才800*600。想想都不现实。很有可能这些信息都是51啦的默认信息,而使用默认信息的原因是51啦没有获得相应的信息——为什么得不到这些信息呢?因为这几个访问者都是Googlebot。 前些日子看了这篇文章,谈到Google百度对于JS的处理是直接跳过的,现在看来不然。Tiny早先的一篇文章说,Google Adsense的爬虫是支持部分js的。而后来的某篇文章(实在搜不出来了)说,Googlebot将和Google Adsense爬虫在抓取时共享一些数据(应该是应用了缓存一样的东西)。把后面两件事联系起来,完全有理由相信,Googlebot现在支持部分js了。 于是我去查阅了本站的Apache日志,发现了相匹配IP访问,只是头信息没有显示为Googlebot——也许是Google正在实验呢?然后我就打开了51啦统计代码,发现最后提交统计信息的一句是用document.write()输出到浏览器然后由浏览器提交到51啦的。document.write()应该是最容易被支持的了,而获得系统分辨率啥的都比较麻烦,对爬虫也没意义,估计Google就没支持。 其实爬虫支持js本来就不是啥技术问题,只是考虑到性能所以大多SE都不支持。从这个意义上说,性能也算是技术问题~ 不知道我猜得对不对,不过通过js生成的链接啥的,肯定对SEO没啥作用。

php输出js

这一段陆续做了两个输出JS的程序。其实做得多了,觉得也无非就是那么回事。去年这个时候,馒头让我在blog侧栏放上他的一段JS,那是不懂编程的我从HACKER的角度看了看,愣是没看明白。转眼做了半年有余的PHP,现在做一个输出JS的东西简直太容易了。 echo “document.write(\”XXXXXXX\”);”; 当年觉得那么奥妙的东西,不过如此简单。技术本身就是这么简单的东西,容易入门,容易上手,容易学成——但终究有那么多人说,“我要学编程!”,然后拼命在讨论XXX语言是不是比XXX好。C++的高手断然不是只会写C++。技术永远都是简单却繁琐,真正要学的东西,是我们驾驭这些技术的能力。 做一个广告,http://www.buyren.net/shop.php要升级了,采用dianping的数据库,礼品卡信息实时更新——相信会焕发出新的活力。只是我不知道智勇对我做的是不是满意。