爬虫基础(2)网页基础

网页基础

网页的组成

网页课以分为三大部分:HTML,CSS和JavaScript。三者结合才能构成一个完善的网页。

1.HTML

HTML 是用来描述网页的一种语言,其全称叫作 Hyper Text Markup Language,即超文本标记语言

图片 img 标签
视频 video 标签
段落 p 标签
他们之间的布局这是由 div标签嵌套组合而成。
各种标签通过补同的排列和嵌套才形成了网页的框架。

可以通过开发者工具,看到每个网站的HTML代码。

2.CSS(让页面美观)

HTML 定义了网页的结构,但是只有 HTML 页面的布局并不美观,可能只是简单的节点元素的排 列,为了让网页看起来更好看一些,这里借助了 css。

在网页中,一般会统一定义整个网页的样式规则,并写人 css 文件中(其后缀为 css )。 在 HTML 中,只需要用 link 标签即可引人写好的 css 文件,这样整个页面就会变得美观、 优雅。

JavaScript(交互画面)

简称JS,一种脚本语言。 HTML和CSS配合使用只能提供一种静态的信息,缺乏交互感。

网页交互体现在:1.下载的进度条显示;2.提示框;3.动画效果等

贡献:它的出现使得用户与信息之间不只是一种浏览与显示的关系,而是实 现了一种实时、动态、交互的页面功能。

网页的结构

<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>This is a Demi</title>
</head>
<body>
<div id = "container">
<div class = "wrapper">
<h2 class = "title">Hello World</h2>
<p class = "text">Hello, this is a paragraph.</p>
</div>
</div>
</body>
</html>
<!DOCTYPE html> 定义了文档的类型为html
<meta charset=”UTF-8”>指定了页面的编码UTF-8
head 标签和 body 标签,分别代表网页头和网页体, 它们也需要结束标签
title 标签则定义了网页的标题
<title>This is a Demi</title>第一了选项卡名子

总结:一个网页的标准形式是 html 标签内嵌套 head 和 body 标签, head 内定义网页的配置和引用, body 内定义网页的正文。

结点树及结点间的关系

HTML 中,所有标签定义的内容都是节点,它们构成了一个 HTML DOM树。

DOM 是 W3C (万维网联盟)的标准,其英文全称 Document O均巳ct Model , 即文档对象模型。 它定义了访问 HTML 和 XML 文档的标准
W3CDOM标准被分为 3 个不同的部分
核心 DOM :针对任何结构化文档的标准模型。 
XML DOM : 针对 XML 文挡的标准模型。
HTML DOM : 针对 HTML 文档的标准模型。

根据 W3C 的 HTML DOM 标准, HTML 文档中的所有内容都是节点
    整个文档是一个文档节点。
    每个 HTML 元素是元素节点。 
    HTML 元素内的文本是文本节点。 
    每个 HTML 属性是属性节点。 
    注释是注释节点。
HTML DOM 将 HTML 文档视作树结构,这种结构被称为节点树

QQ截图20200324171537 本段参考 W3SCHOOL,链接: htφ://www.w3school.com.cn/htmldom/dom_nodes.asp。

选择器

问题:我们知道网页由一个个节点组成, css选择器会根据不同的节点设置不同的样式规则,那么怎样 来定位节点呢?
方法:
#+id.class name.class name
根据id、 class、标签名筛选,请牢记它们的写法。

css css选择器

posted @ 2020-03-28 14:44  ACWink  阅读(131)  评论(0编辑  收藏  举报