随笔分类 - Python3
摘要:Python requests库中文乱码问题汇总(编码) 在用requests爬取网页时,经常会碰到网页的编码问题导致中文乱码 这时首先查看页面源代码,看meta标签里的编码是什么,然后设置成相应的编码即可 但有的时候设置meta标签查看的编码依然乱码,这是可以使用apparent_encoding
阅读全文
摘要:打开 file 并返回一个相应的 文件对象.如果文件不能被打开, 抛出 OSError 异常. 参数 file 是一个字符串表示的文件名称,或者一个数组表示的文件名称。文件名称可以是相对当前目录的路径,也可以是绝对路径表示。(如果给出了一个文件描述器,则当关闭返回的I / O对象时除外,除非clos
阅读全文
摘要:原链接:https://www.cnblogs.com/liushiyi/p/8195666.html 一、Python的变量及其存储 在高级语言中,变量是对内存及其地址的抽象。对于python而言,python的一切变量都是对象,变量的存储,采用了引用语义的方式,存储的只是一个变量的值所在的内存地
阅读全文
摘要:原博:https://www.cnblogs.com/nancyzhu/p/8401552.html 一、对excel的写操作实例: 将一个列表的数据写入excel, 第一行是标题,下面行数具体的数据 二、对excel 的读操作: 三、对excel的修改操作: 将excel中的某个值修改并重新保存
阅读全文
摘要:threading模块 简述: threading模块 threading.currentThread(): 返回当前的线程变量。 threading.enumerate(): 返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前,不包括启动前和终止后的线程。 threading.ac
阅读全文
摘要:进程和线程 参考:https://www.cnblogs.com/renzhuang/articles/6733461.html 是什么: 进程是指在系统中正在运行的一个应用程序;程序一旦运行就是进程,或者更专业化来说:进程是指程序执 行时的一个实例。 线程是进程的一个实体。 进程——资源分配的最小
阅读全文
摘要:定义: Hawkins给出的离群点的本质性定义:离群点是数据集中偏离大部分数据的数据,由于偏离其它数据太多,使人怀疑这些数据的偏离并非由随机因素产生,而是产生于完全不同的机制。 大致分类: 一例分析步骤: 常用离群点检测方法优劣分析: 参考: 离群点检测技术在教育教学中的应用: http://kns
阅读全文
摘要:能for...in...的为可迭代对象 迭代器是⼀个可以记住遍历的位置的对象。迭代器对象从集合的第⼀个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。 判断方法: isinstance() 迭代器定义方法: 生成器: 生成器是一种简单有效的创建迭代器的工具: 1.自动创建__ite
阅读全文
摘要:昨天帮人看了个bug 用python2爬取这个网站(view-source:http://op1.win007.com/Companyhistory.aspx?type=1&id=115&company=%CD%FE%C1%AE%CF%A3%B6%FB(%D3%A2%B9%FA)&matchdate
阅读全文
摘要:1.预登陆 首先手工登陆一次,通过抓包工具或者浏览器控制台分析登陆过程 2.模拟登陆 通常来说简单的爬虫用requests就能搞定 但是这个登陆过程,几次跳转,技术不够,没搞定 尝试使用selenium模拟登陆 selenium:本来用于自动化测试,由于其几乎完全模拟浏览器操作,所以也常用于爬虫 导
阅读全文
摘要:#open()返回文件对象,open(filename,mode): mode: #以文本打开 'r':读取文件 'w':写入文件(同名文件将会删除) 'a':追加文件 'r+':打开并写入文件 #以二进制打开,任何不包含文本的文件(文本模式下会修改行结束符,会损坏非ascll文件) 'b':二进制
阅读全文
摘要:格式化输出: print() write() sys.stdout 值转化成字符串: repr(): 转化为供解释器读取的形式 str(): 转换为供人读取的形式 #将字符串输出到一列,并向左侧填充空格以右对齐,同理还有str.ljust,str.center() str.rjust() #向数值的
阅读全文
摘要:模块的搜索路径: 当前目录 sys.path目录 dir()函数: 搜索模块定义,返回一个字符串类型的存储列表 包,带有__init__.py文件的模块集: #__init__.py文件定义有__all__列表 __all__ = ["xxx","xxx","xxx"] #导入__all__列表的所
阅读全文
摘要:查阅得: 直接赋值:其实就是对象的引用(别名)。 浅拷贝(copy):拷贝父对象,不会拷贝对象的内部的子对象。 深拷贝(deepcopy): copy 模块的 deepcopy 方法,完全拷贝了父对象及其子对象。 直接代码,一目了然 字典浅拷贝实例 >>>a = {1: [1,2,3]}>>> b
阅读全文
摘要:Python3 函数笔记 默认值在函数定义作用域被解析,如下所示: >>> i =5 >>> def f(arg=i): ... print(arg) ... >>> i=6 >>> f() 5 默认值只被赋值一次。这使得当默认值是可变对象时会有所不同,比如列表、字典或者大多数类的实例。例如,下面的
阅读全文
摘要:Python函数默认参数引发的问题 当你定义如下函数时:def f(a, L=[]): L.append(a) return L 尝试输出:print(f(1))print(f(2))print(f(3)) 你可能期望输出:[1][2][3] 实际将输出:[1][1, 2][1, 2, 3] 为什么
阅读全文
摘要:Python3_无题_1 以下是我在看文档时,觉的需要注意的地方对照地址:https://docs.pythontab.com/python/python3.5/index.html #几种运算>>> 17 / 3 # classic division returns a float5.666666
阅读全文
摘要:Python解释器参数传递 以下是我在看文档时,觉的需要注意的地方 对照地址:https://docs.pythontab.com/python/python3.5/index.html 调用解释器时,脚本名和附加参数传入一个名为 sys.argv 的字符串列表。你能够获取这个列表通过执行 impo
阅读全文