微格式和语义网
微格式自诞生之日起,就是为语义网(1998年由Tim Berners Lee提出)服务的。“语义网的核心,是通过给万维网上的文档 (如: HTML)添加能够被计算机所理解的语义(Meta data),从而使整个互联网成为一个通用的信息交换媒介。”
李氏之所以提出语义网,是因为他察觉到了Web数据是半结构化而且异构的。正是Web数据如此杂乱无章,才使搜索引擎多年停留在关键字搜索的阶段。而关键字所搜的问题在于,关键字往往一词多义,比如java和kayak这两个词,导致搜索结果无法很好地匹配用户的需要。简言之,关键字搜索的查全率(recall)很高,但同时冗余度也很高(即精度(precision)偏低)。
2005年Microformat.org网站上线,标志着微格式运动拉开了序幕。尽管在过去七八年间,涌现出了很多试图结构化Web数据的标准(很多都是昙花一现),然而根据Web Data Commons在2012年的调查,在所有添加了结构化数据的网站中,使用微格式的网站所在的领域占所有领域的70%。
  
微格式之所以有如此高的使用率,源于其宗旨:human first,machine second。说白了,微格式可能不如RDF那么严格规范,但它能够被所有懂得HTML的人(不仅包括程序员和专业IT人士,还有很大一部分是网页设计师)使用。阳春白雪的东西可能天生高贵,却不一定生命力顽强。
可能是因为人如其名,微格式只是对HTML进行了微调,所以也从来没有大红大火过。一个令人遗憾的事实是,微格式至今还没有一款杀手级应用,足以让所有人记住它。
下面引用微格式创始人Tantek Çelik的一段话,来说明微格式是如何做到使机器读懂网页信息的:
对于这次与会的人来说,他们可以体验到一个实例——“超新星”的网站在其发布的网页中采用了微格式标记。“超新星大会”的地点列表——不管是在沃顿商学院西校区还是在皇宫酒店的活动——都用hCard标记了出来。因此,只要在“把这些地点加入我的地址簿”的链接上点一下,它们就会被转化为标准的vCard格式,计算机可以轻易地将其导入任何人的地址簿,并同步更新他们的PDA、黑莓等其它设备。
参考文献:
Now is the Time for Your Website to Adopt "Microformats"
microformats.org七周年聚会
对比与澄清:微格式 vs RDF
Microformats: What They Are and How To Use Them
                    
                
                
            
        
浙公网安备 33010602011771号