03 2019 档案

摘要:元祖拆包: 元组拆包可以应用到任何可迭代对象上,唯一的硬性要求是,被可迭代对象中的元素数量必须要跟接受这些元素的元组的空档数一致。除非我们用 * 来表示忽略多余的元素。 最好辨认的元组拆包形式就是平行赋值,也就是说把一个可迭代对象里 的元素,一并赋值到由对应的变量组成的元组中: 另外一个很优雅的写法 阅读全文
posted @ 2019-03-31 10:26 皮皮嘉 阅读(310) 评论(0) 推荐(0)
摘要:标准的列表推导写法: 通常的原则是,只用列表推导来创建新的列表,并且尽量保持简短。如果列表推导的代码超过了两行,你可能就要考虑是不是得用 for 循环重写了。就跟写文章一样,并没有什么硬性的规则,这个度得你自己把握。 filter 和 map 合起来能做的事情,列表推导也可以做,而且还不需要借助难以 阅读全文
posted @ 2019-03-30 22:11 皮皮嘉 阅读(167) 评论(0) 推荐(0)
摘要:如何使用特殊方法: 首先明确一点,特殊方法的存在是为了被 Python 解释器调用的,你自己并不需要调用它们。也就是说没有 my_object.__len__() 这种写法, 而应该使用 len(my_object)。在执行 len(my_object) 的时候,如果 my_object 是一个自定 阅读全文
posted @ 2019-03-29 22:05 皮皮嘉 阅读(176) 评论(0) 推荐(0)
摘要:最近在写爬虫时需要获取javascrip的一些内容,需要配置selenium来使用,在此整理一下我在windows下的安装步骤: 1.安装好chrome浏览器,并在设置里查看chrome的版本,示例如下: 2.下载好对应的chromedriver版本,下载地址:"http://chromedrive 阅读全文
posted @ 2019-03-28 22:00 皮皮嘉 阅读(559) 评论(0) 推荐(0)
摘要:官方网站:"https://selenium-python.readthedocs.io/index.html" Selenium操作主要分两大类:1.得到UI元素: - find_element_by_id - find_elements_by_name - find_elements_by_xp 阅读全文
posted @ 2019-03-28 21:40 皮皮嘉 阅读(706) 评论(0) 推荐(0)
摘要:BeautifulSoup是一个可以从HTML或XML文件中提取数据的Python库,它能实现文档的导航和查找,修改文档等操作 官方文档地址:"https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/" 几个常用提取信息工具的比较: - 正则:很快,使用复 阅读全文
posted @ 2019-03-28 16:24 皮皮嘉 阅读(3086) 评论(0) 推荐(0)
摘要:原文地址:"https://www.cnblogs.com/whaben/p/6495702.html" Python list内置sort()方法用来排序,也可以用python内置的全局sorted()方法来对可迭代的序列排序生成新的序列。 1)排序基础 简单的升序排序是非常容易的。只需要调用so 阅读全文
posted @ 2019-03-28 10:23 皮皮嘉 阅读(19786) 评论(0) 推荐(2)
摘要:原文地址:"https://www.cnblogs.com/laoniubile/p/5904853.html" Python中的random模块用于生成随机数。下面介绍一下random模块中最常用的几个函数。 random.random random.random()用于生成一个0到1的随机符点数 阅读全文
posted @ 2019-03-28 09:48 皮皮嘉 阅读(1976) 评论(0) 推荐(0)
摘要:IO 标记入点,出点JKL 倍速前进,暂停,后退视频C 剃刀工具V 选择工具~ 对原视频全屏编辑(放机)+- 缩放时间轴,。 插入覆盖M 标记从放机里拖拽视频到序列上是默认覆盖,按住ctrl是插入序列上按住alt可以直接复制视频,按住shift可以吸附到断点上 阅读全文
posted @ 2019-03-27 22:36 皮皮嘉 阅读(1662) 评论(0) 推荐(0)
摘要:使用代理服务器去爬虫的原因: 使用同一个IP去爬取同一个网站上的网页,久了之后会被该网站服务器屏蔽。这个时候我们就可以使用代理服务器。因为使用代理服务器去爬取某个网站的时候,在对方的网站上,显示的不是我们真实的IP地址,而是代理服务器的IP地址。 推荐两个获取免费代理服务器的网址: www.goub 阅读全文
posted @ 2019-03-24 12:07 皮皮嘉 阅读(1227) 评论(0) 推荐(0)
摘要:今天在爬取一个网页时发现总是爬取不成功,信息量很少,只有几行代码,而原网页代码量是很多的,后来我把url中的https换成了http后就把网页源码全部爬取了,查了资料后发现url中使用http和https是有很大区别的:http获取数据时信息齐全,https获取数据的信息有缺失,在确定网络地址后,一 阅读全文
posted @ 2019-03-22 13:32 皮皮嘉 阅读(6439) 评论(0) 推荐(0)
摘要:当我们对博客园默认的主题产生审美疲劳的时候,都希望自己的博客拥有一个特殊的主题背景,厌倦了花里胡哨的我终于弄出了一个自己的博客主题,这个简约的主题设置过程如下: 首先需要把博客皮肤设置成一个最简约的模板"SimpleMemory",方便进行之后的设置: 然后在文件选项中上传自己想要的博客图标(ico 阅读全文
posted @ 2019-03-20 00:00 皮皮嘉 阅读(2604) 评论(0) 推荐(0)
摘要:用Python来发送一个电子邮件需要以下几个步骤:1.注册一个邮箱(以QQ邮箱为例)2.需要特殊设置,以QQ邮箱为例:受限进入QQ邮箱的设置中心,点击"账户"选项,下滑可以看到"POP3/IMAP/SMTP/Exchange/CardDAV/CalDAV服务"一栏,把"POP3/SMTP服务"打开( 阅读全文
posted @ 2019-03-17 23:16 皮皮嘉 阅读(770) 评论(0) 推荐(0)
摘要:XML(eXtensibleMarkupLanguage)定义:可扩展标记语言 XML文档的而构成: - 处理指令(可以认为一个文件内只有一个处理指令)最多只有一行,且必须在第一行内容是与xml本身处理起相关的一些声明或者指令以xml关键字开头,一般用于声明XML的版本和采用的编码version属性 阅读全文
posted @ 2019-03-16 23:11 皮皮嘉 阅读(342) 评论(0) 推荐(0)
摘要:序列化:数据转成文本的过程被称为“序列化”,即将对象状态转换为可保持或传输的格式的过程反序列化:对应的,从序列化的格式中解析对象状态的过程被称为“反序列化” pickle的使用方法: - 需要导入pickle包 - pickle.dump() #将数据写入到文件中 - pickle.load() # 阅读全文
posted @ 2019-03-16 00:06 皮皮嘉 阅读(554) 评论(0) 推荐(0)
摘要:在使用open()函数时,明明txt文件和py文件在同一个目录下,如果使用相对路径来打开的话,可以直接在open函数中使用txt文件名,可是在vscode中确一直报错,因为vscode的当前路径可能并不是这个py文件的路径,只有vscode的当前路径和py路径一致时,才可以直接使用txt文件名来打开 阅读全文
posted @ 2019-03-15 12:58 皮皮嘉 阅读(10870) 评论(0) 推荐(0)
摘要:文件的读操作:open() - 第一个参数必须有,表示文件的绝对路径或者相对路径 - 第二个参数mode,表示文件打开的方式 'r':读 'w':写 'a':追加 'r+' == r+w(可读可写,文件若不存在就报错(IOError)) 'w+' == w+r(可读可写,文件若不存在就创建) 'a+ 阅读全文
posted @ 2019-03-15 12:34 皮皮嘉 阅读(872) 评论(0) 推荐(0)
摘要:由于多线程共享进程的资源和地址空间,因此,在对这些公共资源进行操作时,为了防止这些公共资源出现异常的结果,必须考虑线程的同步和互斥问题,由此引出了锁的概念。 Lock的使用方法: - withlock - lock.acquire()和lock.release() 在这个例子中,我们同时start了 阅读全文
posted @ 2019-03-14 20:09 皮皮嘉 阅读(284) 评论(0) 推荐(0)
摘要:使用方法: thread包:有问题,不好用,python3中改成了_thread 使用方法:_thread.start_new_thead(func_name, tuple)参数两个,一个是需要运行的函数名,第二是函数的参数作为元祖使用,为空则使用空元祖注意:如果函数只有一个参数,需要参数后由一个逗 阅读全文
posted @ 2019-03-12 23:59 皮皮嘉 阅读(824) 评论(0) 推荐(0)
摘要:定义:日志是一种可以追踪某些软件运行时所发生事件的方法 作用:软件开发人员可以向他们的代码中调用日志记录相关的方法来表明发生了哪些事情 logging模块中日志的级别: - DEBUG (调试信息) - INFO (一般信息) - WARNING (警告信息) - ERROR (错误信息) - CR 阅读全文
posted @ 2019-03-12 15:24 皮皮嘉 阅读(335) 评论(0) 推荐(1)
摘要:定义:异常是指在语法逻辑正确的前提下,出现的问题。在python里,异常就是一个类 语法: 手动引发异常:当某些情况,用户希望自己引发一个异常的时候,可以使用raise关键字来引发异常 阅读全文
posted @ 2019-03-12 11:58 皮皮嘉 阅读(135) 评论(0) 推荐(0)
摘要:模块的定义:一个模块就是一个包含pytho代码的文件, 后缀名是.py,模块就是一个python文件 如何使用模块: - 假如模块名称直接以数字开头,需要借助importlib帮助 - 语法 import module_nameimport 模块 as 别名from module_name impo 阅读全文
posted @ 2019-03-12 00:07 皮皮嘉 阅读(179) 评论(0) 推荐(0)
摘要:1. 面向对象概述 类和对象的概念 - 类:抽象名词,代表一个集合,共性的事物 - 对象:具象的事物,单个个体 类跟对象的关系 - 一个具象,代表一类事物的某一个个体 - 一个是抽象,代表的是一大类事物 - 表明事物的特征,叫做属性(变量) - 表明事物功能或动作, 称为成员方法(函数) 2. 类的 阅读全文
posted @ 2019-03-07 22:35 皮皮嘉 阅读(952) 评论(0) 推荐(0)
摘要:vscode在调试python文件时提示如下信息: conda : 无法将“conda”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径正确,然后再试一次。 解决办法: 没有添加系统变量,所以系统根本识别不了conda命令,找不到位置。 添加以下系 阅读全文
posted @ 2019-03-01 22:39 皮皮嘉 阅读(58623) 评论(0) 推荐(2)