2020年4月11日
摘要: 1、一般Python程序第一行需要加入 #-*- coding: utf-8-*- 或者 # coding = utf-8 这样可以在代码中包含中文 2、在Python中,是用函数实现单一功能货相关联功能的代码段,可以提高可读性和代码重复率,函数代码快以def关键词开头个,后接空格、函数标识符名称、 阅读全文
posted @ 2020-04-11 23:31 Satellite4Chan 阅读(57) 评论(0) 推荐(0)
摘要: 1、准备工作 通过浏览器查看分析目标网页,学习编程基础规范 2、获取数据 通过HTTP库向目标站点发起请求,请求可以包含额外的header等信息,如果服务器能正常响应,会得到一个Response,便是所要获取的页面内容 3、解析内容 得到的内容可能是HTML、json等格式,可以用页面解析库、正则表 阅读全文
posted @ 2020-04-11 16:17 Satellite4Chan 阅读(112) 评论(0) 推荐(0)
  2020年3月29日
摘要: 一、安装库 爬虫主要使用Python(字符串|urllib)+Selenium+PhantomJS+BeautifulSoup。还另外需要pip install httplib2。 二、Urllib下载网页及图片 由于案例是python2,一些语句使用python3时会报错: 1、import ur 阅读全文
posted @ 2020-03-29 22:42 Satellite4Chan 阅读(52) 评论(0) 推荐(0)