随笔分类 - Python
摘要:问题描述:Python从网站中抓取网页文本保存到MySQL数据中,对应数据库字段为longtext,字符编码utf-8。部分插入成功,部分插入失败,报错如下。1366, "Incorrect string value: '\\xF0\\x9F\\x91\\x89\\xE3\\x80...' for
阅读全文
摘要:Python判断文件是否存在的三种方法 目录 1.使用os模块 判断文件是否可做读写操作 2.使用Try语句 3. 使用pathlib模块 正文 通常在读写文件之前,需要判断文件或目录是否存在,不然某些处理方法可能会使程序出错。所以最好在做任何操作之前,先判断文件是否存在。 这里将介绍三种判断文件或
阅读全文
摘要:文件的打开的两种方式 f = open("data.txt","r") #设置文件对象 f.close() #关闭文件 #为了方便,避免忘记close掉这个文件对象,可以用下面这种方式替代 with open('data.txt',"r") as f: #设置文件对象 str = f.read()
阅读全文
摘要:学习内容: 1.字符串转列表 2.列表转字符串 1. 字符串转列表 str1 = "hi hello world" print(str1.split(" ")) 输出: ['hi', 'hello', 'world'] 2. 列表转字符串 l = ["hi","hello","world"] pri
阅读全文
摘要:python代码的编码格式 #coding:utf-8 在操作文件时,如果文件名带有中文,则需要将文件路径以Unicode的编码格式进行操作 具体的方式如下 path = "你的路径" ipath = unicode(path, "utf8")# 也可以使用以下方法Path = open(u'行业拆
阅读全文
摘要:1、去空格及特殊符号 复制代码代码如下: s.strip().lstrip().rstrip(',') 2、复制字符串 复制代码代码如下: #strcpy(sStr1,sStr2)sStr1 = 'strcpy'sStr2 = sStr1sStr1 = 'strcpy2'print sStr2 3、
阅读全文
摘要:https://blog.csdn.net/weixin_44318830/article/details/103739987
阅读全文
摘要:在用scrapy做爬虫的时候,需要将数据存入的es中。网上找了两种方法,照葫芦画瓢也能出来,暂记下来: 首先安装了es,版本是5.6.1的较早版本 用pip安装与es版本相对的es相关包 pip install elasticsearch-dsl==5.1.0 方法一: 以下是pipelines.p
阅读全文
摘要:一、校验数字的表达式 1 数字:^[0-9]*$ 2 n位的数字:^\d{n}$ 3 至少n位的数字:^\d{n,}$ 4 m-n位的数字:^\d{m,n}$ 5 零和非零开头的数字:^(0|[1-9][0-9]*)$ 6 非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]
阅读全文
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)
摘要:在使用selenium处理中文网页或者网页标题是中文的时候,出现UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128), from selenium im
阅读全文
摘要:我使用python的MySQLdb模块实现了一个mysql client, 在测试时,出现了如下错误 Python模块MySQLdb操作mysql出现2019错误:Can't initialize character set utf-8 解决方法: 将utf-8改为utf8就可以了,千万不要想当然!
阅读全文
摘要:d={[]:”str”,{}:”11”} TypeError: unhashable type: ‘dict’ python不支持dict的key为list或dict类型,因为list和dict类型是unhashable(不可哈希)的。 参考:https://blog.csdn.net/u01264
阅读全文
摘要:在命令行可以一次执行多个命令,有以下几种: 1.每个命令之间用 ; 隔开 说明:各命令的执行结果,不会影响其它命令的执行。换句话说,各个命令都会执行, 但不保证每个命令都执行成功。 cd /home/PyTest/src; python suning.py 2.每个命令之间用&&隔开 说明:若前面的
阅读全文
摘要:# -*- coding: utf-8 -*- import os import sys import time # Sets how many days old files are deleted # To delete the path and the following subfiles cl
阅读全文
摘要:总结一下Python解释器包含的一系列的内置函数,下面表格按字母顺序列出了内置函数: 下面就一一介绍一下内置函数的用法: 1、abs() 返回一个数值的绝对值,可以是整数或浮点数等。 print(abs(-18)) print(abs(0.15)) result: 18 0.15 2、all(ite
阅读全文
摘要:方法一: f = open("foo.txt") # 返回一个文件对象 line = f.readline() # 调用文件的 readline()方法 while line: print line, # 后面跟 ',' 将忽略换行符 # print(line, end = '') # 在 Pyth
阅读全文
摘要:vars() 查看当前文件中内置全局变量以字典方式返回内置全局变量 __doc__ :获取文件的注释 __file__ 【重点】获取当前文件的路径 所在模块:os 变量作用:指向当前文件 当前文件的完整路径:os.path.abspath(__file__) 当前文件所属目录:os.path.dir
阅读全文
摘要:描述: 在Python当中,如果代码写得规范一些,通常会写上一句“if __name__==’__main__:”作为程序的入口,但似乎没有这么一句代码,程序也能正常运行。这句代码多余吗?原理又在哪里?本篇博文对此进行总结说明。 作用一:程序入口 学过Java、C、C++的程序员应该都知道,每次开启
阅读全文
摘要:怎么样将scrapy每个模块的打印信息输出到同一个日志文件中? 1、知识点 """ logging : scrapy: settings中设置LOG_LEVEL="WARNING" settings中设置LOG_FILE="./log.log" #设置日志保存的位置,设置后在终端不会显示日志内容 i
阅读全文
摘要:我在使用python写爬虫时用到了requests.get()方法: def openUrl(url, ip, agent): #函数形参为url:网页地址; ip:ip池; agent:User-Agent, 三者均为字符串类型 requests.get(url, headers=agent, p
阅读全文

浙公网安备 33010602011771号