Python笔记——真正认识html

2017.12.24

之前做爬虫时虽然已经与html打过交道,但说实话,仅仅是根据教程和案例了解如何从html格式中爬取特定想要获取的信息。对html本身并没有真正深入的认识。今天我希望能回过头来好好学习一下html的基础知识。

Question1:什么是 HTML?

HTML 是用来描述网页的一种语言。准确来说是一种超文本标记语言 (Hyper Text Markup Language)。HTML使用标记标签来描述网页。

Question2:什么是HTML 标签?

HTML 标签是由尖括号包围的关键词,比如 <html>。HTML 标签通常是成对出现的,比如 <b> 和 </b>。

PS:常见的HTML标签如:

  • <html> 与 </html> 之间的文本描述网页
  • <body> 与 </body> 之间的文本是可见的页面内容
  • <h1> 与 </h1> 之间的文本被显示为标题(1-6分别代表了标题的主要次序)
  • <p> 与 </p> 之间的文本被显示为段落

PS2:HTML标签对大小写不敏感

Question3:如何显示HTML文档?

HTML 文档包含 HTML 标签和纯文本,HTML 文档也被称为网页。Web 浏览器的作用是读取 HTML 文档,并以网页的形式显示出它们。浏览器不会显示 HTML 标签,而是使用标签来解释页面的内容。

Question4:HTML中的链接怎么定义?

HTML 链接是通过 <a> 标签进行定义的。如:

  • <a href="https://www.zhihu.com/">This is a link</a>

在 href 属性中指定链接的地址。

Question5:HTML中的图像怎么定义?

HTML 图像是通过 <img> 标签进行定义的。如:

  • <img src="people.jpg" width="102" height="142" />

图像的名称和尺寸是以属性的形式提供的。(单位是像素)

Question6:什么是HTML标签的属性?

HTML 标签可以拥有属性。属性提供了有关 HTML 元素的更多的信息。

属性总是以名称/值对的形式出现,比如:name="value"。

属性总是在 HTML 元素的开始标签中规定。

属性值应该始终被包括在引号内。

属性例子:

  • <h1 align="center"> 表示该标题当居中对齐,align代表对齐属性。
  • <body bgcolor="yellow"> 表示文档背景颜色为黄色,bgcolor代表背景颜色属性。

PS:新版本的 (X)HTML 要求属性使用小写。

完整的 HTML 参考手册 

Question7:什么是HTML的style属性?

style 属性提供了一种改变所有 HTML 元素的样式的通用方法,能够通过使用 style 属性直接将样式添加到 HTML 元素,或者间接地在独立的样式表中(CSS 文件)进行定义。

举个例子:

<html>
<body style="background-color:yellow">
<h2 style="background-color:red">This is a heading</h2>
<p style="background-color:green">This is a paragraph.</p>
</body>
</html>

style 属性淘汰了“旧的” bgcolor 属性。

再比如,style的font-family、color 以及 font-size 属性分别定义元素中文本的字体系列、颜色和字体尺寸:

<html>

<body>
<h1 style="font-family:verdana">A heading</h1>
<p style="font-family:arial;color:red;font-size:20px;">A paragraph.</p>
</body>

</html>
posted @ 2017-12-24 17:04  东方少侠  阅读(255)  评论(0)    收藏  举报