[爬虫]1.2.1 HTML标签和属性

HTML(HyperText Markup Language)是一种用于创建网页的标记语言。HTML文档由一系列的HTML标签构成,每个标签都有自己的意义和用途。HTML标签通常成对出现,由一个开始标签和一个结束标签组成,结束标签的名称前有一个斜杠。

例如,<p>是一个段落标签的开始,</p>是一个段落标签的结束。在这两个标签之间的内容是一个段落。

<p>这是一个段落。</p>

常见的HTML标签

以下是一些常见的HTML标签:

  • <h1><h6>:定义标题,<h1>是最大的标题,<h6>是最小的标题。
  • <p>:定义段落。
  • <a>:定义超链接。
  • <img>:定义图像。
  • <ul>:定义无序列表。
  • <ol>:定义有序列表。
  • <li>:定义列表项目。
  • <div>:定义文档中的区段(division/section)。
  • <span>:定义文# HTML标签和属性

HTML(HyperText Markup Language)是一种用于创建网页的标记语言。HTML文档由一系列的HTML标签构成,每个标签都有自己的意义和用途。HTML标签通常成对出现,由一个开始标签和一个结束标签组成,结束标签的名称前有一个斜杠。

例如,<p>是一个段落标签的开始,</p>是一个段落标签的结束。在这两个标签之间的内容是一个段落。

<p>这是一个段落。</p>

常见的HTML标签

以下是一些常见的HTML标签:

  • <h1><h6>:定义标题,<h1>是最大的标题,<h6>是最小的标题。
  • <p>:定义段落。
  • <a>:定义超链接。
  • <img>:定义图像。
  • <ul>:定义无序列表。
  • <ol>:定义有序列表。
  • <li>:定义列表项目。
  • <div>:定义文档中的区段(division/section)。
  • <span>:定义文档中的行内元素。
  • <table>:定义表格。

HTML属性

HTML标签可以有属性,属性提供了关于元素的额外信息。属性总是在HTML元素的开始标签中指定,常常以名称/值对的形式出现,如:name="value"

以下是一些常见的HTML属性:

  • class:为HTML元素定义一个或多个类名(classname)(类名从样式文件引入)
  • id:定义元素的唯一id
  • src:定义嵌入内容的资源(URL)。常用于img标签,指定图像的来源URL。
  • href:定义链接的目标URL。常用于a标签,创建一个指向其他网页的链接。
  • alt:定义图像的替代文本。如果图像无法显示,将显示此属性的值。

以下是使用属性的一个例子:

<a href="https://www.example.com">这是一个链接</a>

在上述例子中,<a>标签定义了一个链接,href属性指定了链接的目标URL。

HTML和CSS的学习是一个过程,通过不断的实践和应用,你将逐步掌握这些知识。在开始网络爬虫的学习之前,对HTML有基本的理解是非常有帮助的,因为你将经常需要解析HTML文档来提取信息。
推荐阅读:

https://mp.weixin.qq.com/s/dV2JzXfgjDdCmWRmE0glDA

https://mp.weixin.qq.com/s/an83QZOWXHqll3SGPYTL5g

file

posted @ 2023-07-24 23:06  博客0214  阅读(21)  评论(0编辑  收藏  举报