会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
退役小学生
学习本是一个不断抄袭、模仿、练习、创新的过程。
博客园
首页
新随笔
联系
管理
上一页
1
···
4
5
6
7
8
9
10
11
12
···
22
下一页
2022年6月26日
章节九:cookies
摘要: #章节九:cookies 第1-8关我们学习的是爬虫最为基础的知识,从第9关开始,我们正式打开爬虫的进阶之门,学习爬虫更多的精进知识。 在前面几关,我们实操的爬虫项目里都没有涉及到登录这一行为。 但实际很多情况下,由于网站的限制,不登录的话我们只能爬取到一小部分信息。 而我们想要登录的话,则需要带上
阅读全文
posted @ 2022-06-26 12:22 退役小学生
阅读(130)
评论(0)
推荐(0)
2022年6月25日
章节八:爬取知乎文章
摘要: #章节八:爬取知乎文章 你造吗,今天是个大喜的日子!来到这儿,就意味着你爬虫已经入门啦! 在这个重要又喜悦的日子里,我们就干三件事:回顾前路、项目实操、展望未来。 回顾前路,是为了复习1-7关所学的知识。项目实操,是通过写一个爬虫程序把所学的知识用起来。展望未来,是预告一下我们之后会遇到的风景。 马
阅读全文
posted @ 2022-06-25 23:19 退役小学生
阅读(1176)
评论(0)
推荐(0)
2022年6月24日
章节七:csv&excel
摘要: #章节七:csv&excel ##1. 存储数据的方式 其实,常用的存储数据的方式有两种——存储成csv格式文件、存储成Excel文件(不是复制黏贴的那种)。 我猜想,此时你会想问“csv”是什么,和Excel文件有什么区别? 前面,我有讲到json是特殊的字符串。其实,csv也是一种字符串文件的格
阅读全文
posted @ 2022-06-24 17:45 退役小学生
阅读(202)
评论(0)
推荐(0)
章节六:带参数请求数据
摘要: #章节六:带参数请求数据 ##1. 复习 Network能够记录浏览器的所有请求。我们最常用的是:ALL(查看全部)/XHR(仅查看XHR)/Doc(Document,第0个请求一般在这里),有时候也会看看:Img(仅查看图片)/Media(仅查看媒体文件)/Other(其他)。最后,JS和CSS,
阅读全文
posted @ 2022-06-24 10:19 退役小学生
阅读(144)
评论(0)
推荐(0)
2022年6月23日
章节五:json
摘要: #章节五:json ##1. 复习 当然,还要有复习。在上一关,我们使用两种方式,爬取了热门菜谱清单,内含:菜名、原材料、详细烹饪流程的URL。代码如下: # 引用requests库 import requests # 引用BeautifulSoup库 from bs4 import Beautif
阅读全文
posted @ 2022-06-23 16:21 退役小学生
阅读(131)
评论(0)
推荐(0)
2022年6月22日
章节四:BeautifulSoup实践
摘要: #章节四:BeautifulSoup实践 解密吴氏私厨,意思就是到吴枫的厨房去看一看,看一看有没有什么好吃的。希望你会喜欢这一关。 ##1. 复习 上一关,我们学习了用BeautifulSoup库解析数据和提取数据,解析数据的方法是: 提取数据的方法是用find() 与find_all() 最后,我
阅读全文
posted @ 2022-06-22 09:31 退役小学生
阅读(167)
评论(0)
推荐(0)
2022年6月21日
章节三:BeautifulSoup
摘要: #章节三:BeautifulSoup 上一关,我们学习了HTML基础知识,知道了HTML是一种用来描述网页的语言,又了解了HTML的基本结构。 认识了HTML中的常见标签和常见属性: 根据这些知识,我们成功修改了这个网页上原来所显示标题——“这个书苑不太冷”,改成了“蜘蛛侠大战网页”。 最后,还写了
阅读全文
posted @ 2022-06-21 11:02 退役小学生
阅读(238)
评论(0)
推荐(0)
2022年6月20日
章节二:HTML基础
摘要: #章节二:HTML基础 ##1. 爬虫,从网页开始 ###1.1 为什么要学习HTML? 按道理来说,下面该学习爬虫的第1步: 数据解析了吧? 别急别急,心急爬不了热豆腐。在此之前,先来道送分题,我们要的数据藏哪里来着? 藏在网页当中,对吧。上一节课,老师提到,当我们在Chrome浏览器上,拿着ur
阅读全文
posted @ 2022-06-20 17:40 退役小学生
阅读(150)
评论(0)
推荐(0)
章节一:认识爬虫
摘要: #章节一:认识爬虫 ##1. 初识爬虫 ###1.1 什么是爬虫? 到底什么是爬虫呢? 爬虫,从本质上来说,就是利用程序在网上拿到对我们有价值的数据。 爬虫能做很多事,能做商业分析,也能做生活助手,比如:分析北京近两年二手房成交均价是多少?深圳的Python工程师平均薪资是多少?北京哪家餐厅粤菜最好
阅读全文
posted @ 2022-06-20 10:11 退役小学生
阅读(239)
评论(0)
推荐(0)
前言:测试
摘要: #前言:测试 ##1. 关于下面的代码说法正确的是(A) def s(): c = a +b return c A、定义的函数名叫s B、函数能计算两个数的和 C、这个函数能正常使用 D、s(1,2)的返回值为3 ##2. 下列关于编码说法错误的是(C) A、utf-8编码后的数据可用于网络传输 B
阅读全文
posted @ 2022-06-20 10:09 退役小学生
阅读(54)
评论(0)
推荐(0)
上一页
1
···
4
5
6
7
8
9
10
11
12
···
22
下一页
公告