Python笔记——真正认识html
2017.12.24
之前做爬虫时虽然已经与html打过交道,但说实话,仅仅是根据教程和案例了解如何从html格式中爬取特定想要获取的信息。对html本身并没有真正深入的认识。今天我希望能回过头来好好学习一下html的基础知识。
Question1:什么是 HTML?
HTML 是用来描述网页的一种语言。准确来说是一种超文本标记语言 (Hyper Text Markup Language)。HTML使用标记标签来描述网页。
Question2:什么是HTML 标签?
HTML 标签是由尖括号包围的关键词,比如 <html>。HTML 标签通常是成对出现的,比如 <b> 和 </b>。
PS:常见的HTML标签如:
- <html> 与 </html> 之间的文本描述网页
- <body> 与 </body> 之间的文本是可见的页面内容
- <h1> 与 </h1> 之间的文本被显示为标题(1-6分别代表了标题的主要次序)
- <p> 与 </p> 之间的文本被显示为段落
PS2:HTML标签对大小写不敏感
Question3:如何显示HTML文档?
HTML 文档包含 HTML 标签和纯文本,HTML 文档也被称为网页。Web 浏览器的作用是读取 HTML 文档,并以网页的形式显示出它们。浏览器不会显示 HTML 标签,而是使用标签来解释页面的内容。
Question4:HTML中的链接怎么定义?
HTML 链接是通过 <a> 标签进行定义的。如:
- <a href="https://www.zhihu.com/">This is a link</a>
在 href 属性中指定链接的地址。
Question5:HTML中的图像怎么定义?
HTML 图像是通过 <img> 标签进行定义的。如:
- <img src="people.jpg" width="102" height="142" />
图像的名称和尺寸是以属性的形式提供的。(单位是像素)
Question6:什么是HTML标签的属性?
HTML 标签可以拥有属性。属性提供了有关 HTML 元素的更多的信息。
属性总是以名称/值对的形式出现,比如:name="value"。
属性总是在 HTML 元素的开始标签中规定。
属性值应该始终被包括在引号内。
属性例子:
- <h1 align="center"> 表示该标题当居中对齐,align代表对齐属性。
- <body bgcolor="yellow"> 表示文档背景颜色为黄色,bgcolor代表背景颜色属性。
PS:新版本的 (X)HTML 要求属性使用小写。
Question7:什么是HTML的style属性?
style 属性提供了一种改变所有 HTML 元素的样式的通用方法,能够通过使用 style 属性直接将样式添加到 HTML 元素,或者间接地在独立的样式表中(CSS 文件)进行定义。
举个例子:
<html> <body style="background-color:yellow"> <h2 style="background-color:red">This is a heading</h2> <p style="background-color:green">This is a paragraph.</p> </body> </html>
style 属性淘汰了“旧的” bgcolor 属性。
再比如,style的font-family、color 以及 font-size 属性分别定义元素中文本的字体系列、颜色和字体尺寸:
<html> <body> <h1 style="font-family:verdana">A heading</h1> <p style="font-family:arial;color:red;font-size:20px;">A paragraph.</p> </body> </html>

浙公网安备 33010602011771号