摘要:
1. 小试牛刀 怎样扒网页呢? 其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS、CSS,如果把网页比作一个人,那么HTML便是他的骨架,JS便是他的肌肉,CSS便是它的衣服。所以最重要的部分是存 阅读全文
posted @ 2020-07-09 11:24
kuanleung
阅读(13)
评论(0)
推荐(0)
摘要:
1. 常用的工具 pythonpycharm浏览器 chrome火狐 fiddler 2 fiddler的使用 2.1 界面含义 请求 (Request) 部分详解 名称含义Headers显示客户端发送到服务器的 HTTP 请求的,header 显示为一个分级视图,包含了 Web 客户端信息、Coo 阅读全文
posted @ 2020-07-09 11:23
kuanleung
阅读(7)
评论(0)
推荐(0)
摘要:
1. 什么是爬虫? 网络爬虫也叫网络蜘蛛,如果把互联网比喻成一个蜘蛛网,那么蜘蛛就是在网上爬来爬去的蜘蛛,爬虫程序通过请求url地址,根据响应的内容进行解析采集数据, 比如:如果响应内容是html,分析dom结构,进行dom解析、或者正则匹配,如果响应内容是xml/json数据,就可以转数据对象,然 阅读全文
posted @ 2020-07-09 11:20
kuanleung
阅读(18)
评论(0)
推荐(0)

浙公网安备 33010602011771号