摘要: from app import app import pymysql import config class Database: aurl = config.aurl user = config.user password =config.password db = config.db charse 阅读全文
posted @ 2021-11-06 14:51 三月减肥的猫 阅读(40) 评论(0) 推荐(0)
摘要: Client< >Server客户端和服务端 Brower< >Server#浏览器和服务端 网络通信:跨地域数据传输 >通信网络=物理链接的介质(交换机,线缆,中转站等)+互联网通信协议 互联网通信协议: 应用层,传输层,网络层,数据链路层,物理层协议:规定的数据组织格式:头部+数据部分 物理层: 阅读全文
posted @ 2021-10-04 21:51 三月减肥的猫 阅读(392) 评论(0) 推荐(0)
摘要: 1、selenium介绍 selenium最初是一个自动化测试工具,模拟用户的操作。而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏 阅读全文
posted @ 2021-10-03 15:34 三月减肥的猫 阅读(975) 评论(0) 推荐(0)
摘要: Python模块之xlwings对excel的简单操作使用 阅读全文
posted @ 2021-09-16 14:51 三月减肥的猫 阅读(15006) 评论(0) 推荐(0)
摘要: 1、引入 在Python的爬虫项目中,通常需要解析获取到的页面内容,得到特定节点中的数据。所以需要解析工具,可以选择:正则式,bs4,xpath等。在这里我们选择使用Xpath对HTML内容解析 XPath,全称XML Path Language,即XML路径语言,可以在XML,HTML文档中查找信 阅读全文
posted @ 2021-09-15 16:40 三月减肥的猫 阅读(8801) 评论(0) 推荐(0)
摘要: 1、Requests介绍 Requests 是使用 Apache2 Licensed 许可证的 基于Python开发的HTTP 库,其在Python内置模块的基础上进行了高度的封装,从而使得Pythoner进行网络请求时,变得美好了许多,使用Requests可以轻而易举的完成浏览器可有的任何操作。支 阅读全文
posted @ 2021-09-15 10:21 三月减肥的猫 阅读(324) 评论(0) 推荐(0)
摘要: 什么是爬虫:通过编写程序,模拟浏览器上网,然后让其去互联网抓取数据的过程爬虫的分类: 通用爬虫 抓取系统的重要部分(搜素引擎),一整张页面数据 聚焦爬虫 在通用爬虫的基础上,抓取页面上的特定数据 增量式爬虫 监测网站中数据更新的情况,只会抓取更新的内容爬虫中的矛与盾: 反爬机制 门户网站,可以通过定 阅读全文
posted @ 2021-09-15 09:27 三月减肥的猫 阅读(46) 评论(0) 推荐(0)
摘要: Python的日志模块 阅读全文
posted @ 2021-09-14 23:40 三月减肥的猫 阅读(358) 评论(0) 推荐(0)
点击右上角即可分享
微信分享提示