摘要: 需求: 将爬取数据保存到数据库 将爬取数据保存为txt文件 将txt文件内容生成为词云 查看爬取到数据库的数据信息 代码如下: import os.path import requests import pymysql import parsel import csv #保存csv文件 import 阅读全文
posted @ 2022-12-23 11:26 __username 阅读(54) 评论(0) 推荐(0)
摘要: 一.正则表达式 记录下目前常用的,后续用到新的会持续更新-0-0- 正则:用来匹配字符串的一门表达语言 练习:https://tool.oschina.net/regex/ 1.正则支持普通字符 2.元字符(用一个符号来匹配一堆内容) \d 能够匹配一个数字(0-9) \w 能够匹配数字,字母,下划 阅读全文
posted @ 2022-12-22 13:36 __username 阅读(40) 评论(0) 推荐(0)
摘要: 如需打包所运行的第三方库版本 命令如下: pip freeze > requirements.txt pycharm里面 构建虚拟环境 个人习惯加点(表示隐藏) 安装其它库 出现此错误 解决方法一:管理员的方式打开 Powershell 运行,并在命令窗口输入 set-executionpolicy 阅读全文
posted @ 2022-12-22 11:22 __username 阅读(22) 评论(0) 推荐(0)
摘要: xpath表达式 格式: 属性: //*[@属性="属性值"] 文本值: //*[text()="文本值"] 高级查询: contains模糊查询(包含): contains(@属性/text(),值) --> //*[contains(@属性/text(),值)] starts-with 匹配一个 阅读全文
posted @ 2022-12-22 10:05 __username 阅读(31) 评论(0) 推荐(0)
摘要: 本人使用就是看着不爽 >版本:4.9.0 解决方法 ```python chrome_options = webdriver.ChromeOptions() chrome_options.add_experimental_option("excludeSwitches", ['enable-auto 阅读全文
posted @ 2022-12-21 13:20 __username 阅读(397) 评论(0) 推荐(0)
摘要: 创建多线程 # coding=gbk # -*- coding:uft-8 -*- # @Time: 2022/12/20 # @Author: 十架bgm # @FileName: 创建线程时传递参数 import time import threading def fun1(num): for 阅读全文
posted @ 2022-12-20 15:26 __username 阅读(47) 评论(0) 推荐(0)
摘要: # docs输入 **python -m pydoc -p 0** 回车出现http://localhost:7550/ 复制url完事!!! # 利用pycharm 查看方法和第三方库文档 ![](https://img2023.cnblogs.com/blog/3005444/202305/30 阅读全文
posted @ 2022-12-19 21:52 __username 阅读(96) 评论(0) 推荐(0)
摘要: **好文手敲下,每天码代码~ 加油** **三目运算符** ```py a = 1 b = 2 # a+b不大于3执行后面的else语句 b-a = 1 print(a+b if a+b>3 else b-a) ``` # 一、列表 ## 1.1列表的定义 ​ 白话来讲:放数据的,啥都可以放,用[] 阅读全文
posted @ 2022-12-19 13:11 __username 阅读(73) 评论(0) 推荐(0)
摘要: csv文件读写链接地址:csv文件的写入与读取 excel文件转化csv格式 import pandas as pd data = pd.read_excel('123.xls','Sheet1',index_col=0) data.to_csv('data.csv',index = False,e 阅读全文
posted @ 2022-12-19 13:10 __username 阅读(19) 评论(0) 推荐(0)
摘要: 1.技巧 打印的字标红 # \033[31m可用\033[0m 例如: a = 1 print(a,'\033[31m变红\033[0m') 2.IP池 与 IP提取 ip池 # coding=gbk # -*- coding:uft-8 -*- # @Time: 2022/12/18 # @Aut 阅读全文
posted @ 2022-12-19 02:10 __username 阅读(49) 评论(0) 推荐(0)