摘要: Linux crontab定时执行任务 命令格式与详细例子,大家可以参考下。 基本格式 : * * * * * command 分 时 日 月 周 命令 第1列表示分钟1~59 每分钟用*或者 */1表示 第2列表示小时1~23(0表示0点) 第3列表示日期1~31 第4列表示月份1~12 第5列标 阅读全文
posted @ 2016-08-17 12:02 水晶球 阅读(1043) 评论(0) 推荐(0) 编辑
摘要: 1、type():接受一个对象作为参数,并返回它的类型 >>> b array([0, 1, 2, 3]) >>> type(b) <type 'numpy.ndarray'> 2、cmp(a,b):比较两个对象的大小,如果a小于b,返回一个负整数; >>> c,d=-4,12 >>> cmp(c, 阅读全文
posted @ 2016-09-20 16:37 水晶球 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 1、sorted()函数:内建函数,适用于所有类型,返回排序后的对象,原对象不改变,sorted(a,key=,reversed=True) >>> sorted((3,1,4,2)) [1, 2, 3, 4] >>> a=[4111,1,52,46,200,6,7] >>> sorted(a) [ 阅读全文
posted @ 2016-09-18 14:59 水晶球 阅读(1042) 评论(0) 推荐(0) 编辑
摘要: 一、numpy.loadtxt读取数据 data=numpy.loadtxt('数据路径.txt',delimiter=',',usecols=(0,1,2,3) , dtype=float)#读取后是多元数组格式 然后利用数组的特征获取不同列 value=data[:,0:3],classfiy= 阅读全文
posted @ 2016-09-14 16:14 水晶球 阅读(1226) 评论(0) 推荐(0) 编辑
摘要: 两类文档存储在两个路径下,假设每类文档有25个文档 def spamTest(): docList = [] classList = [] fullText = [] for i in range(1,26):#循环读取所有的txt,并解析成列表 wordlist = textParse(open( 阅读全文
posted @ 2016-09-14 11:55 水晶球 阅读(933) 评论(0) 推荐(0) 编辑
摘要: python序列包含列表[]、元组()、字符串三种 列表 一、列表基本内容 1、建立:a=[1,2,3,5],通过[ , ,], >>>b=[6,7,8,9] 2、索引:a[0]=1 3、切片:a[0:2],a[:] 4、删除:del a[索引]; a.remove(5) ;a.pop(索引),会返 阅读全文
posted @ 2016-09-14 11:50 水晶球 阅读(2215) 评论(1) 推荐(1) 编辑
摘要: Numpy的重要特点就是其N维数组对象, 1、ndarray每个元素是相同的,每个数组都有一个两个对象: .shape:用于表示维度大小的元组 .dtype:用户表示数组类型的对象 2、创建数组 array(将输入数据(列表、元组、数组或其他序列类型)转化为ndarray) array ([[列表1 阅读全文
posted @ 2016-09-06 16:12 水晶球 阅读(1808) 评论(0) 推荐(0) 编辑
摘要: 未经同意请勿转载http://www.cnblogs.com/smallcrystal/ 前文已经详细介绍DataFrame与Series两种数据结构,下面介绍DataFrame与Series的数据基本手段 一、pandas两种数据结构的index是不可修改的,pandas对象的一个重要方法是rei 阅读全文
posted @ 2016-08-26 15:31 水晶球 阅读(555) 评论(0) 推荐(0) 编辑
摘要: Series与DataFrame对比学习 文章为本人原创,未经同意请勿转载,http://www.cnblogs.com/smallcrystal/ Series:构建的方法,一组数组(列表或元组),利用Series(),自动生成索引。或Series(字典),值只有一列,无列索引,只有行索引 属性: 阅读全文
posted @ 2016-08-26 15:07 水晶球 阅读(9557) 评论(0) 推荐(0) 编辑
摘要: Series是一种类似于一维数组的对象,又一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即是索引)组成。 可以将Series看成是一个定长的有序字段,因为它是索引值到数据值的一个映射。 import pandas as pd >>>obj=pd.Series([4,5,6,7])#仅 阅读全文
posted @ 2016-08-25 20:03 水晶球 阅读(322) 评论(0) 推荐(0) 编辑
摘要: 1、逻辑函数 假设数据集有n个独立的特征,x1到xn为样本的n个特征。常规的回归算法的目标是拟合出一个多项式函数,使得预测值与真实值的误差最小: 而我们希望这样的f(x)能够具有很好的逻辑判断性质,最好是能够直接表达具有特征x的样本被分到某类的概率。比如f(x)>0.5的时候能够表示x被分为正类,f 阅读全文
posted @ 2016-08-17 16:54 水晶球 阅读(2367) 评论(1) 推荐(0) 编辑