摘要: 问题 解决方案在安装目录下找到lib/maven-model-builder-3.6.0.jar选择使用压缩包打开,根据这个目录META-INFmavenorg.apache.mavenmaven-model-builder找到pom.xml然后找到第一个 <build> 标签,在里面第一行添加 < 阅读全文
posted @ 2021-12-10 20:08 超级爱度假 阅读(1330) 评论(0) 推荐(0)
摘要: 如何从Windows中删除Node.js: 1.从windows添加删除程序中选择nodejs卸载。 2.重新启动(或者您可能会从任务管理器中杀死所有与节点相关的进程)。 3.寻找这些文件夹并删除它们(及其内容)(如果还有)。根据您安装的版本,UAC设置和CPU架构,这些可能或可能不存在: C:\P 阅读全文
posted @ 2021-12-07 09:12 超级爱度假 阅读(969) 评论(0) 推荐(1)
摘要: 相对于selenium,PhantomJs的无界面浏览器占用内存较小,在爬取数据的时候无需自动开启界面,但是可以通过设置来实现selenium的我界面抓取,具体操作: 1 from selenium import webdriver 2 # 创建chrome参数对象 3 opt = webdrive 阅读全文
posted @ 2021-02-25 22:48 超级爱度假 阅读(184) 评论(0) 推荐(0)
摘要: inspectdb使用步骤 1.配置项目setting文件 2.配置项目__init__.py 使用pymysql连接数据库 1 import pymysql 2 pymysql.version_info = (1, 20, 23) 3 pymysql.install_as_MySQLdb() 3. 阅读全文
posted @ 2021-02-07 14:24 超级爱度假 阅读(280) 评论(0) 推荐(0)
摘要: 直接在查询界面执行如下语句: 1 SET SQL_SAFE_UPDATES = 0; 阅读全文
posted @ 2021-01-11 19:04 超级爱度假 阅读(153) 评论(0) 推荐(0)
摘要: 1.打开cmd进入MySQL的bin目录;(如我的路径是C:\Program Files\MySQL\MySQL Server 8.0\bin) 2.通过输入命令 mysql -u root -p 指定root用户登录MySQL,输入后回车会提示输入密码,输入我们原来的密码然后回车。 之后输入(如修 阅读全文
posted @ 2020-12-30 16:34 超级爱度假 阅读(94) 评论(0) 推荐(0)
摘要: 有时候,我们使用selenium用来获取一些元素时,需要等待页面将某些元素加载网站才能够获取我们需要的数据,所以,这时候我们就需要等待页面的功能。 1、显式等待(推荐) 显式等待是你在代码中定义等待一定条件发生后再进一步执行你的代码。 最糟糕的案例是使用time.sleep(),它将条件设置为等待一 阅读全文
posted @ 2020-12-27 11:30 超级爱度假 阅读(128) 评论(0) 推荐(0)
摘要: 1.从pipeline的字典形式可以看出来,pipeline可以有多个,而且确实pipeline能够定义多个 2. 有多个爬虫,pipeline是怎样处理的呢? 首先创建三个爬虫 : 例如: 在一个scrapy的项目里面爬取三个网站: 今日头条、新浪、豆瓣 在cmd里面分别创建三个爬虫: 然后打开p 阅读全文
posted @ 2020-12-25 15:50 超级爱度假 阅读(1429) 评论(0) 推荐(1)
摘要: 1 import scrapy 2 from text_info.items import TextInfoItem 3 4 class A50zwSpider(scrapy.Spider): 5 name = '50zw' 6 allowed_domains = ['m.50zw.la'] 7 s 阅读全文
posted @ 2020-12-25 09:27 超级爱度假 阅读(744) 评论(0) 推荐(0)
摘要: 在Python语言中最常见的括号有三种,分别是:小括号()、中括号[]、花括号{};其作用也不相同,分别用来代表不同的Python基本内置数据类型。 Python中的小括号(): 代表tuple元祖数据类型,元祖是一种不可变序列。创建方法很简单,大多数时候都是小括号括起来的 1 >>> tup = 阅读全文
posted @ 2020-12-24 11:55 超级爱度假 阅读(1658) 评论(0) 推荐(0)