随笔分类 -  Python文件操作

摘要:问题13:如何在for语句中迭代多个可迭代的对象 from random import randint a1 = [randint(10, 50) for _ in range(5)] a2 = [randint(10, 50) for _ in range(5)] a3 = [randint(10 阅读全文
posted @ 2019-08-30 13:46 不夜男人
摘要:问题14:如何拆分含有多种分隔符的字符串 方法一:连续使用str.spilt()方法,每次处理一种分隔符; str.split()方法的应用:按某一种分隔符分割字符串; #不能用单词字符进行分割(字母、数字、下划线) A、str.split()的用法 #此处是str.spilt(),而不是re.sp 阅读全文
posted @ 2019-08-30 13:45 不夜男人
摘要:问题15:如何判断字符串a是否以字符串b开头或结尾 方法一:使用正则表达式的^和$实现 '^000':表示,只匹配字符串的开头,若开头是 '000' ,则返回 ['000'] ; '000$':表示,只匹配字符串的结尾,若结尾是 '000' ,则返回 ['000'] ; #弊端:一次只能匹配一种能, 阅读全文
posted @ 2019-08-30 13:44 不夜男人
摘要:问题16:如何调整字符串中文本的格式 案例:修改字符串中日期的表示方式 方案:使用re.sub()方法,对字符串中的内容进行排序替换; import re r = '2018-04-10 heyongcan zai xue python' #将文件a中的内容读取到r1变量中 # r1 = open( 阅读全文
posted @ 2019-08-30 13:43 不夜男人
摘要:问题17:如何将多个小字符串拼接成一个大的字符串 功能:实现字符串拼接 方案一:迭代列表,连续使用‘+’操作依次拼接每一个字符串; r1 = ['abc', '123', 'def', '456', 'hig', '789'] s1 = '' #方法一:直接相加 #弊端:造成浪费; #原因:每进行一 阅读全文
posted @ 2019-08-30 13:42 不夜男人
摘要:问题19:如何去掉字符串中不需要的字符 案例一:过滤空白字符; 案例二:过滤\r字符; 案例三:去掉文本中的unicode组合符:拼音的音调; #具体实现,参加:Python:删除字符串中的字符 方案一:字符串strip()、lstrip()、rstrip()方法,去掉字符串两端字符; 方案二:使用 阅读全文
posted @ 2019-08-30 13:41 不夜男人
摘要:问题18:如何对字符串进行左、右、居中对齐 案例:如何实现,让字典d显示时按冒号对齐 方案一:使用字符串的str.ljust(),str.rjust(),str.center()函数进行左、右、居中对齐 d = { 'a':1, 'aa':11, 'aaa':111, 'aaaa':1111, 'a 阅读全文
posted @ 2019-08-30 13:41 不夜男人
摘要:问题20:如何读写文本文件 关于文件操作,参考:Python:文件操作 知识点杂集: 一、文件存储与读取的步骤: 1)思路: str.encode('编码格式'):对unicode字符串进行编码,编码成连续字节的格式,才能存放到文件中,即物理介质上; str.decode('解码格式'):对物理介质 阅读全文
posted @ 2019-08-30 13:24 不夜男人
摘要:问题21:如何处理二进制文件 一、二进制文件的结构 1、结构:头部信息 + 数据; 头部信息:是对这个文件是结构的介绍信息,相当于书本的目录; 数据:文件各个结构的具体信息,相当于书本的内容; 2、打开二进制文件 例:f = open(path, 'rb'):以只读形式打开指定文件; 3、读取文件: 阅读全文
posted @ 2019-08-30 13:23 不夜男人
摘要:问题22:如何设置文件的缓冲 一、什么是文件的缓冲? 1、说明 将文件内容写入到硬件设备时,比如磁盘的扇区,则需要进行系统调用,这类I/O操作的耗时很长,为了减少I/O操作的次数,文件通常使用缓冲区(当需要写入的字节数不足一个块时,将数据放入缓冲区,当数据凑够一个块的大小后才进行系统调用); 2、文 阅读全文
posted @ 2019-08-30 13:22 不夜男人
摘要:问题23:如何将文件映射到内存 一、说明 1)什么叫映射? ==>就是给一个对象(可以是变量、物理等),起一个唯一的别名,建立一一对应的关系; 2)文件映射:将磁盘上的文件的位置,与进程逻辑地址空间中一块大小相同的区域之间的一一对应; 3)映射后得到一个类似数组类型的东西(mmap.mmap()对象 阅读全文
posted @ 2019-08-30 13:21 不夜男人
摘要:问题24:如何访问文件的状态 一、案例:在某些项目中,需要获取文件的状态 文件状态:os.stat(path) 1、文件的类型:普通文件、目录、符号链接、设备文件或管道(一般在Linux上)。。。 2、文件的访问权限:一般为读、写、执行,3个权限; 3、文件的最后的访问时间(对应read操作)、最后 阅读全文
posted @ 2019-08-30 13:20 不夜男人
摘要:问题25:如何使用临时文件 临时文件功能:存储临时数据到磁盘上; 临时文件特点:不用命名,关闭后悔自动被删除; 案例: 某项目中,我们从传感器采集数据,每收集到1G数据后,做数据分析,最终只保存分析结果。这样会产生很大的临时数据,如果这些临时数据常驻内存,将消耗大量内存资源,我们可以使用临时文件存储 阅读全文
posted @ 2019-08-30 13:19 不夜男人
摘要:(一)简单线性回归 和之前介绍的KNN不同,KNN主要是解决分类问题,而线性回归顾名思义显然是用来解决回归问题的。线性回归具有如下特征: 解决回归问题 思想简单,实现容易 许多强大的非线性模型的基础,比如逻辑回归、多项式回归、svm等等 结果具有很好的可解释性 蕴含机器学习中的很多重要思想 但是在之 阅读全文
posted @ 2019-08-23 09:18 不夜男人
摘要:(一)什么是梯度下降法 梯度下降法 和之前介绍的k近邻算法和线性回归法不同,梯度下降法不是一个机器学习算法。它既不能解决分类问题也不能解决回归问题,那梯度下降是什么呢?以及它的作用又是什么呢?其实,梯度下降法是一种基于搜索的最优化方法。作用就是最小化一个损失函数,或者最大化一个效用函数,当然最大化一 阅读全文
posted @ 2019-08-23 09:17 不夜男人
摘要:(一)什么是pca pca,也就是主成分分析法(principal component analysis),主要是用来对数据集进行降维处理。举个最简单的例子,我要根据姓名、年龄、头发的长度、身高、体重、皮肤的白皙程度(随便想的)等特征来预测一个人的性别,但这些特征中有一个是最没有用的,是什么的?显然 阅读全文
posted @ 2019-08-23 09:16 不夜男人
摘要:(一)什么是多项式回归 还记得线性回归法吗?线性回归法有一个很大的局限性,那就是需要数据是有一定的线性关系的,但是现实中的很多数据是没有线性关系的。多项式就是用来解决这个问题的,可以处理非线性数据 在线性回归中,我们是假设数据具有线性关系的,因此我们在简单线性回归中,将直线的方向设置为y=ax+b的 阅读全文
posted @ 2019-08-23 09:14 不夜男人
摘要:1.什么是逻辑回归 在介绍逻辑回归之前,我们来看一张图 根据专业统计,逻辑回归是除了军事和安全领域之外,被使用频率最高的机器学习算法。所以逻辑回归的重要性不言而喻,尽管它很简单,但是很重要。所以没有最牛逼的算法,只是根据不同的场景,使用最合适的算法。 逻辑回归这个算法,听名字好像是一个回归算法,但它 阅读全文
posted @ 2019-08-23 09:13 不夜男人
摘要:废话不多说,直接上代码 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 import numpy as np # 如何创建一个数组 arr = np.array([1, 2, 3, 4]) print(arr) # [1 2 3 4] 阅读全文
posted @ 2019-08-23 09:10 不夜男人
摘要:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 阅读全文
posted @ 2019-08-23 09:08 不夜男人