摘要: Element模块下的代码只能一行一行复制,想要复制一个代码块,可以把该代码块先收起来,再对这个收起来的代码块进行复制就OK了 阅读全文
posted @ 2020-10-12 21:15 ShineLe 阅读(2713) 评论(0) 推荐(0)
摘要: 如果我们要编写一个搜索引擎,第一步是用爬虫把目标网站的页面抓取下来,第二步就是解析该HTML页面,看看里面的内容到底是新闻、图片还是视频。 假设第一步已经完成,那么第二步该如何解析HTML呢? HTML本质上XML的子集,但是HTML的语法没有XML那么严格,所以不能用标准的DOM或者SAX来解析H 阅读全文
posted @ 2020-10-12 19:56 ShineLe 阅读(27) 评论(0) 推荐(0)
摘要: urllib提供了一系列用于操作URL的功能。 GET urllib的request模块可以非常方便地抓取URL内容,也就是发送一个GET请求到指定的页面,然后返回HTTP的响应: 例如,对豆瓣的一个URL https://api.douban.com/v2/book/2129650 进行抓取,并返 阅读全文
posted @ 2020-10-12 16:22 ShineLe 阅读(133) 评论(0) 推荐(0)
摘要: 学习自:https://www.jianshu.com/p/4c3e228940c8 使用参数、关键字访问服务器 访问网络的两种方法: 1、GET 利用参数给服务器传递信息 参数data为dict类型,然后用parse.urlencode()编码为str类型,用编码后的data+baseURL构成完 阅读全文
posted @ 2020-10-12 15:59 ShineLe 阅读(2253) 评论(0) 推荐(0)