浅谈Web语义化
什么是语义化?其实简单的说,就是让机器可以读懂内容。
- Tim·Berners-Lee爵士是万维网联盟主席。
- Tim·Berners-Lee爵士是英国著名计算机科学家,也是麻省理工学院教授。
我们可以很容易理解上面的句子,但计算机可以么?
任何语句都是由所属语法规则创建的。我们有自己的语法规则,可以轻松理解上面的句子,但计算机有它不同于我们的语法规则。
1980年的那个夏天,Tim·Berners-Lee爵士创建了万维网原型系统ENQUIRE,他当时可能不会想到这个只是为了方便研究人员分享及更新讯息的系统,如今却深入人们生活的方方面面。随着Web规模不断扩大,数据不断增长,在web上检索信息变的越来越困难,因此数据挖掘与处理等技术应运而生,所以让计算机更好的读懂web内容成为了刚需。
我们熟知的每张页面大都是由(X)HTML&XML(负责结构),CSS(负责样式),W3C DOM&ECMAScript(负责动作)三部分组成,而web语义化首先要强调的就是结构语义化,只有搭建好一个清晰且干净的结构,计算机才能更好的读懂它所获取的HTML文档,进而早日实现Tim·Berners-Lee爵士的美好愿景--语义网。但在实现web语义化的过程中也出现了两种观点;
- 发展AI,让计算机理解能力接近人类;
- 用语义信息描述内容,降低计算机处理信息的难度。
目前而言,无论选择哪种方法,都不是最理想的。前者在技术上有很大难度,后者实施起来也很麻烦,但我们现在大多走的就是第二条路,对HTML标准进行改进,将结构合理的语义化,这算是在通往美好未来的道路上迈出了一小步。
最后援引码头老师关于web语义化的几点好处:
- 去掉或样式丢失的时候能让页面呈现清晰的结构;
- 屏幕阅读器(如果访客有视障)会完全根据你的标记来“读”你的网页;
- Pad、手机等设备可能无法像普通电脑的浏览器一样来渲染网页(通常是因为这些设备对CSS的支持较弱);
- 搜索引擎的爬虫也依赖于标记来确定上下文和各个关键字的权重;
- 你的页面是否对爬虫容易理解非常重要,因为爬虫很大程度上会忽略用于表现的标记,而只注重语义标记;
- 便于团队开发和维护。
浙公网安备 33010602011771号