随笔分类 -  python

摘要:数据准备: 加载 组装: 合并:pandas.mege() 拼接:pandas.concat() 组合:pandas.DataFrame.combine_first() 变形 删除 合并: 1.根据列合并 没有指定根据那一列合并 import numpy as np import pandas as 阅读全文
posted @ 2019-04-21 13:45 乄一叶知秋 阅读(260) 评论(0) 推荐(0)
摘要:1、安装虚拟环境 pip install virtualenv 验证是否安装成功 virtualenv --version 2、安装虚拟环境管理工具 windows安装: pip install virtualenvwrapper-win 用mkvirtualenv命令 创建的虚拟环境才能使用vir 阅读全文
posted @ 2019-04-21 13:42 乄一叶知秋 阅读(159) 评论(0) 推荐(0)
摘要:multiprocessing模块为在子进程中运行任务、通信和共享数据,以及执行各种形式的同步提供支持。进程没有任何共享状态,如果某个进程修改数据,改动只限于该进程内。 Process()类:表示运行在一个子进程中的任务。 class Process(object): def __init__(se 阅读全文
posted @ 2019-04-21 13:36 乄一叶知秋 阅读(225) 评论(0) 推荐(0)
摘要:子节点 一个Tag可能包含多个字符串或其它的Tag,这些都是这个Tag的子节点.Beautiful Soup提供了许多操作和遍历子节点的属性. 注意: Beautiful Soup中字符串节点不支持这些属性,因为字符串没有子节点 1. tag的名字 操作文档树最简单的方法就是告诉它你想获取的tag的 阅读全文
posted @ 2019-04-21 13:35 乄一叶知秋 阅读(378) 评论(0) 推荐(0)
摘要:正则 re中要转义的特殊字符 | 特殊字符 | 说明 | | : | : | | $ | 匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 ‘\n' 或 ‘\r'。要匹配 $ 字符本身,请使用 。 | | \(\) | 标记一个子表达式的开始和结束 阅读全文
posted @ 2019-04-21 13:32 乄一叶知秋 阅读(144) 评论(0) 推荐(0)
摘要:threading模块提供 Thread类和各种同步原语,用于编写多线程的程序。 Thread对象 Thread类用于表示单独的控制线程。使用下面的函数可以创建一个新线程。 Thread(group=None, target=None, namesNone, args=(), kwargs=()) 阅读全文
posted @ 2019-04-21 13:31 乄一叶知秋 阅读(126) 评论(0) 推荐(0)
摘要:ndim:维度 shape:行数和列数 size:元素个数 [[1 2 3] [4 5 6]] number of dim: 2 shape : (2, 3) size: 6 指定数据 dtype int32 int32 float64 float32 创建特定数据 [[ 2 23 4] [ 2 3 阅读全文
posted @ 2019-04-21 13:30 乄一叶知秋 阅读(158) 评论(0) 推荐(0)
摘要:``` import hashlib # ######## md5 ######## hash = hashlib.md5() hash.update('admin') print hash.hexdigest() # ######## sha1 ######## hash = hashlib.sha1() hash.update('admin') print hash.hexd... 阅读全文
posted @ 2019-04-21 13:28 乄一叶知秋 阅读(85) 评论(0) 推荐(0)
摘要:matplotlib架构 matplotlib架构分为三层:各层之间单向通信,即每一层只能与它的下一层通信,而下层无法与上层通信。 Scripting(脚本)层: Artist(变现层): Backend(后端层): Backend层 在matplotlib的架构中,最下面一层为 Backend层。 阅读全文
posted @ 2019-04-21 13:20 乄一叶知秋 阅读(706) 评论(0) 推荐(0)
摘要:series对象 1.声明series对象 没有指定标签: 指定标签: 查看组成series对象的:index和values 2.选择内部元素: 3.为元素赋值: 4.用numpy数组或其他series对象定义新series对象 5.筛选元素: 6.series对象运算和数学函数 7.seri对象的 阅读全文
posted @ 2019-04-21 13:17 乄一叶知秋 阅读(208) 评论(0) 推荐(0)
摘要:在 中,字符串只有一个 方法, 类型只有一个 方法 logging模块 用于便捷记录日志且线程安全的模块 配置logging基本的设置,然后在控制台输出日志 basicConfig的参数: 1.filename:指定打开的文件名 2.filemode:和file函数意义相同,指定日志文件的打开模式, 阅读全文
posted @ 2019-04-21 13:14 乄一叶知秋 阅读(156) 评论(0) 推荐(0)
摘要:threading模块提供 Thread类和各种同步原语,用于编写多线程的程序。 Thread对象 Thread类用于表示单独的控制线程。使用下面的函数可以创建一个新线程。 Thread(group=None, target=None, namesNone, args=(), kwargs=()) 阅读全文
posted @ 2019-04-21 13:13 乄一叶知秋 阅读(161) 评论(0) 推荐(0)
摘要:时间相关的操作,时间有三种表示方式: 时间戳 1970年1月1日之后的秒,即:time.time() 格式化的字符串 2014 11 11 11:11, 即:time.strftime('%Y %m %d') 结构化时间 元组包含了:年、日、星期等... time.struct_time 即:tim 阅读全文
posted @ 2019-04-21 13:13 乄一叶知秋 阅读(99) 评论(0) 推荐(0)
摘要:##机器学习 ### 有监督学习和无监督学习 - 根据数据和所要创建的模型的类型,学习问题可以分为两大类。 - 有监督学习。训练集包含作为预测结果(目标值)的额外的属性信息。这些信息可以指导模型对新数据(测试集)作出跟已有数据类似的预测结果。 - 分类:训练集数据属于两种或以上类别;已标注的数据可指 阅读全文
posted @ 2019-04-21 13:03 乄一叶知秋 阅读(368) 评论(0) 推荐(0)
摘要:### argmin() 和 argmax() :求矩阵中最小元素和最大元素的索引 ```python import numpy as np A = np.arange(2,14).reshape((3,4)) print(A) print(np.argmin(A)) print(np.argmax 阅读全文
posted @ 2019-04-21 12:56 乄一叶知秋 阅读(229) 评论(0) 推荐(0)
摘要:urllib包提供了一个高级接口,用于编写需要与HTTP服务器、FTP服务器和本地文件交互的客户端。典型的应用程序包括从网页抓取数据、自动化、代理、Web爬虫等。 1. urllib.request \(\) 该模块最常见的用途是通过HTTP从Web服务器获取数据。 urlopen\(url \[, 阅读全文
posted @ 2019-04-21 12:34 乄一叶知秋 阅读(315) 评论(0) 推荐(0)
摘要:## numpys属性 * ndim:维度 * shape:行数和列数 * size:元素个数 ```python import numpy as np #导入numpy array = np.array([[1,2,3],[4,5,6]]) #创建数组 print(array) ``` [[1 2 阅读全文
posted @ 2019-04-21 12:26 乄一叶知秋 阅读(204) 评论(0) 推荐(0)
摘要:1、安装虚拟环境 pip install virtualenv验证是否安装成功 virtualenv –version 2、安装虚拟环境管理工具 windows安装: pip install virtualenvwrapper-win 用mkvirtualenv命令 创建的虚拟环境才能使用virtu 阅读全文
posted @ 2019-04-21 12:24 乄一叶知秋 阅读(137) 评论(0) 推荐(0)
摘要:方法一: 1.执行 命令 2.这时肯定会报错,由于scrapy依赖的包比较多,执行上述操作,已经将大部分的依赖包安装好 3.安装Twisted:下载 "网址" 4.下载完成后,可以进入下载文件的目录执行 5.再次执行 命令 方法二: 依次执行以下操作: 1.wheel pip install whe 阅读全文
posted @ 2018-10-10 16:56 乄一叶知秋 阅读(243) 评论(0) 推荐(0)