产品经理学Python-爬虫攻坚no.1

Windows操作系统

1、各种教程-安装Python 解释器-3.7版本、IDE工具-Pycharm,

2、网络爬虫基本原理

  ①发起请求-,出发一个Resquest(请求方式(post/get、put/delete等))+Headers-键值对;

  ②获取响应内容-Response,类型包括HTML/json、二进制等;(Status状态码、响应头Response Headers、响应体-请求的资源响应)

  ③解析对应内容,使用正则、网页解析库、json、二进制对象等(解析库:BeautifulSoup / PyQuery XPath)

  ④保存数据,文本文件或数据库等

 

下一步学习:

文件读写操作:with open()

 

posted @ 2019-08-10 21:17  波哥产品  阅读(290)  评论(0)    收藏  举报