摘要: 一、图像 1、图像标签(<img>)和源属性(<Src>) 在HTML中,图像由<img>标签定义,<img>是空标签,它只包含属性,并且没有闭合标签。 要在页面上显示图像,需要使用源属性(src)。源属性的值是图像URL地址。 定义图像的语法是: <img src="url" alt="some_ 阅读全文
posted @ 2018-01-28 13:37 扬帆_一点零 阅读(112) 评论(0) 推荐(0)
摘要: 一、HTML head 元素 二、HTML 样式-CSS 1、HTML使用样式: <!DOCTYPE html><html><head><meta charset="utf-8"> <title>菜鸟教程(runoob.com)</title><style type="text/css">h1 {c 阅读全文
posted @ 2018-01-28 09:36 扬帆_一点零 阅读(953) 评论(0) 推荐(0)
摘要: 1、常见正则表达式符号和特殊字符 2、常见正则表达式属性 3、re模块函数的使用 match方法匹配字符串 search()方法匹配字符串 匹配多个字符 []字符集 用groups()子组获得一个包含所有匹配子组的元组 匹配字符串的起始和结尾以及单词边界 findall()和finditer() s 阅读全文
posted @ 2018-01-24 11:08 扬帆_一点零 阅读(144) 评论(0) 推荐(0)
摘要: 一、BeautifulSoup类的基本元素 1、Tag的name(名字) 每个<tag>都有自己的名字,通过<tag>.name获取,字符串类型 >>> from bs4 import BeautifulSoup >>> soup=BeautifulSoup(demo,"html.parser") 阅读全文
posted @ 2018-01-19 20:16 扬帆_一点零 阅读(270) 评论(0) 推荐(0)
摘要: 一、Beautiful Soup 库的安装 Win平台:“以管理员身份运行” cmd 执行 pip install beautifulsoup4 安装小测:from bs4 import BeautifulSoup soup=BeautifulSoup('<p>data</p>','html.par 阅读全文
posted @ 2018-01-07 23:03 扬帆_一点零 阅读(275) 评论(0) 推荐(0)
摘要: 实例1:京东商品页面的爬取 import requests url="https://item.jd.com/2967929.html" try: r=requests.get(url) r.raise_for_status() r.encoding=r.apparent_encoding prin 阅读全文
posted @ 2017-12-19 20:32 扬帆_一点零 阅读(209) 评论(0) 推荐(0)
摘要: 1、安装 Win 平台:“以管理员身份运行” cmd,执行 pip install requests 小测: >>>import requests >>>r=requests.get("http://www.baidu.com") >>>print(r.status_code) 200 >>>r.t 阅读全文
posted @ 2017-12-19 19:46 扬帆_一点零 阅读(386) 评论(0) 推荐(0)
摘要: *开始标签常被称为起始标签(opening tag),结束标签常称为闭合标签(closing tag)。 HTML 标签对大小写不敏感:<P> 等同于 <p>。推荐使用小写标签。 1、HTML 标题(Heading)是通过<h1> - <h6> 标签来定义的. 如:<h1>这是一个标题</h1> 2 阅读全文
posted @ 2017-12-13 17:43 扬帆_一点零 阅读(130) 评论(0) 推荐(0)
摘要: 1、超文本标记语言(英语:HyperText Markup Language,简称:HTML)是一种用于创建网页的标准标记语言。 注意:对于中文网页需要使用 <meta charset="utf-8"> 声明编码,否则会出现乱码。有些浏览器会设置 GBK 为默认编码,则你需要设置为 <meta ch 阅读全文
posted @ 2017-12-13 16:03 扬帆_一点零 阅读(151) 评论(0) 推荐(0)