收藏: google.com 首页代码分析

google.com 首页代码分析

机缘巧合,对 google.com 的首页代码产生了浓厚兴趣。一点“分析”,杂记如下:

不同浏览器推送不同代码

google_src_diff.png

上图是在不同浏览器下,保存的 google 首页代码。
注意:文件大小是经过 IntelliJ IDEA 格式化处理后的大小。

其中 Chrome 和 Safari 的代码是一样的,Opera 仅仅一个 js 函数的写法与 Chrome 不同。差异最大的是 Firefox 和 IE。

我的想法:大部分应用场景下,针对不同浏览器实现不同版本,会增加开发和维护成本。google 首页采取这种差异化方案,很可能是考虑到要最大限度降低网页流量。毕竟对于日访问量上千万的网站来说,减少一个字符都能节约可观的流量。精简节约,在 google 首页上体现得淋漓尽致,下面会继续提及。

doctype 的写法

只有 Firefox 用了<!doctype html>来激活标准模式。其它浏览器下,都是简单粗暴的 Quirks 模式。

我的想法:Firefox 下也可以直接用 Quirks 模式,视觉差异上极小。不清楚 google 为何仅针对 Firefox 开启了标准模式。

值得注意的是,在 google 搜索结果页,所有浏览器下都使用了<!doctype html>. 毕竟结果页复杂些,依旧用 Quirks 模式的话,会增加开发成本。首页因为简单,Quirks 和 Standards 相比,没什么显著差别,因此能省就省。

关于 doctype, 强烈推荐阅读:Activating Browser Modes with Doctype

对浏览器来说,doctype 实际上仅影响浏览模式,因此能从简就从简。W3C 校验,我觉得没必要,很少关注。

精简,还是精简

以 Firefox 下 google 首页的源码为例:

  1. html, body 缺胳膊少腿
  2. html 元素的很多属性没有用双引号括起来
  3. class, id 等命名很短
  4. script 和 style 元素没 type 等属性
  5. 没有 keywords 和 description 等 meta 值,我是搜索老大,哈哈
  6. balabala 等等

想起一句话:遵守规范的一个重要标准,就是知道何时打破它,并大胆地打破。从这层意义上讲,google 首页是非常遵守规范的。

没有完美

细心点,还可以发现:

  1. 引号去得不彻底,比如<img alt="Google" ...
  2. 还有padding-left: 0px, px 可以去掉

js 上,也有进一步精简的余地。比如下面两行完全一样的代码,很囧:

if(google.y) google.y.first = [];
if(google.y) google.y.first = [];

还有一段代码,div 提前到 script 前面能省去判断:

<script>
function wgjp() {
var xjs = document.createElement('script');
xjs.src = '/extern_chrome/1mZ_-PL2Zjc.js';
(document.getElementById('xjsd') || document.body).appendChild(xjs)
};
</script>
<div id=xjsd></div>

也许吹毛求疵了,笑过。

预加载

看代码:

<body onload="sf();if(document.images){new Image().src='/images/nav_logo4.png'}" ...

这就是 YSlow 34条性能法则中的 Preload Components. google 首页提前加载了搜索结果页的 css sprite. 另外赞一下这个 sprite 图的组织,很 cute.

延迟加载

看代码:

window.setTimeout(function() {
var a = document.createElement("script");
a.src = "/extern_js/f/.../XRt_2Y4Z5sM.js";
(document.getElementById("xjsd") || document.body).appendChild(a)
}, 0);

上面这个 js 挺大的,包含了 google 的 js 库和输入框的提示补全组件。这个 setTimeout 起到了将下载进程延迟到 window.onload 后。很小的代码调整,却提升了不少用户体验,实在划算。

另提一下,这个 js 在不同浏览器下也有不同版本,大小差异比较明显。为了尽可能减少流量,google 还真费心。

奇淫技巧

代码虽少,淫荡之处却摇曳生姿:

1. 遍历数组

for (var i = 0,c; c = ["ad","p","pa","zd","ac","pc","pah","ph","zc"][i++];) {
// doing something, such as console.log(c)
}

2. 短路语句

function _gjp() {
!(window._gjwl.hash && window._gjuc()) && setTimeout(_gjp, 500)
}

短路表达式很常用,但用短路单独做语句,还真精简。

语义化

从语义上讲,google 的 html 代码是比较糟糕的。但考虑到各种浏览终端,或许 google 目前的写法非常优化。没有接触过跨n > 20的浏览器开发经验,对此不多说。


 

访问: http://lifesinger.org/blog/2009/06/google-com-src-study/

posted @ 2009-07-06 00:08  斩梦人.天天  阅读(296)  评论(0)    收藏  举报