12 2017 档案

摘要:参考:https://www.cnblogs.com/zhangduo/p/4440314.html 导入CSV、TXT文件 read.table函数:read.table函数以数据框的格式读入数据,所以适合读取混合模式的数据,但是要求每列的数据数据类型相同。 read.table读取数据非常方便, 阅读全文
posted @ 2017-12-26 14:36 caiqingfei 阅读(18552) 评论(0) 推荐(0)
摘要:删除pandas DataFrame的某一/几列: 方法一:直接del DF['column-name'] 方法二:采用drop方法,有下面三种等价的表达式: 1. DF= DF.drop('column_name', 1); 2. DF.drop('column_name',axis=1, inp 阅读全文
posted @ 2017-12-26 10:40 caiqingfei 阅读(71269) 评论(0) 推荐(0)
摘要:参考:http://www.php.cn/wenda/91257.html https://www.cnblogs.com/king-lps/p/7846414.html http://blog.csdn.net/kancy110/article/details/75043202 阅读全文
posted @ 2017-12-25 17:24 caiqingfei 阅读(2032) 评论(0) 推荐(0)
摘要:可以参考:http://blog.sina.com.cn/s/blog_80572f5d0101anxw.html 阅读全文
posted @ 2017-12-25 17:22 caiqingfei 阅读(5106) 评论(0) 推荐(0)
摘要:待续! 阅读全文
posted @ 2017-12-25 17:21 caiqingfei 阅读(336) 评论(0) 推荐(0)
摘要:相信有很多人收这个问题的困扰,如果你想一次性在pandas.DataFrame里添加几列,或者在指定的位置添加一列,都会很苦恼找不到简便的方法;可以用到的函数有df.reindex, pd.concat 我们来看一个例子: df 是一个DataFrame, 如果你只想在df的后面添加一列,可以用下面 阅读全文
posted @ 2017-12-25 10:18 caiqingfei 阅读(170568) 评论(0) 推荐(2)
摘要:Python中集成R :参考博客http://blog.csdn.net/weidelight/article/details/44946785 阅读全文
posted @ 2017-12-19 22:15 caiqingfei 阅读(850) 评论(0) 推荐(0)
摘要:转载:http://blog.163.com/qianshch%40126/blog/static/48972522201092254141315/ 聚类的目标是使同一类对象的相似度尽可能地大;不同类对象之间的相似度尽可能地小。目前聚类的方法很多,根据基本思想的不同,大致可以将聚类算法分为五大类:层 阅读全文
posted @ 2017-12-18 11:12 caiqingfei 阅读(7752) 评论(0) 推荐(0)
摘要:分类是数据挖掘、机器学习和模式识别中一个重要的研究领域。通过对当前数据挖掘中具有代表性的优秀分类算法进行分析和比较,总结出了各种算法的特性,为使用者选择算法或研究者改进算法提供了依据。 一、分类算法概述 解决分类问题的方法很多 ,单一的分类方法主要包括:决策树、贝叶斯、人工神经网络、K-近邻、支持向 阅读全文
posted @ 2017-12-18 11:06 caiqingfei 阅读(13532) 评论(0) 推荐(1)
摘要:数据规范化处理是数据挖掘的一项基本操作。现实中,数据中不同特征的量纲可能不一致,数值间的差别可能很大,不进行处理可能会影响到数据分析的结果,因此,需要对数据按照一定比例进行缩放,使之落在一个特定的区域,便于进行综合分析。特别是基于距离的挖掘方法,在建模前一定要对数据进行规范化处理,如SVM,KNN, 阅读全文
posted @ 2017-12-17 21:41 caiqingfei 阅读(7842) 评论(0) 推荐(0)
摘要:下周写! 阅读全文
posted @ 2017-12-17 13:50 caiqingfei 阅读(265) 评论(0) 推荐(0)
摘要:学习中! 阅读全文
posted @ 2017-12-17 13:49 caiqingfei 阅读(425) 评论(0) 推荐(0)
摘要:学习中! 阅读全文
posted @ 2017-12-17 13:48 caiqingfei 阅读(407) 评论(0) 推荐(0)
摘要:学习中! 阅读全文
posted @ 2017-12-17 13:47 caiqingfei 阅读(420) 评论(0) 推荐(0)
摘要:现实世界中的数据总是“脏的”,主要体现在数据不准确,不完整,不一致,含有噪声和异常等,而数据清洗的目的就是尽可能的使现实中的数据变得准确,完整,一致,真实,可信。 下面逐一讨论如何对存在这些问题数据进行清理。 先从简单的开始: 一 ,数据不完整,即数据中存在缺失值,对于缺失值的处理主要有以下几种方法 阅读全文
posted @ 2017-12-17 13:46 caiqingfei 阅读(1662) 评论(0) 推荐(0)
摘要:学习中! 阅读全文
posted @ 2017-12-17 13:46 caiqingfei 阅读(369) 评论(0) 推荐(0)
摘要:转自:http://blog.csdn.net/wangying19911991/article/details/73928172 https://www.zhihu.com/question/58993137 python中的axis究竟是如何定义的呢?他们究竟代表是DataFrame的行还是列? 阅读全文
posted @ 2017-12-12 16:24 caiqingfei 阅读(157361) 评论(5) 推荐(27)
摘要:转自:http://baike.xsoftlab.net/view/250.html 写的很全面,建议对Map不太熟悉的朋友,认真的看下!我这里就不贴出来了,大家可以访问前面那个网址。 阅读全文
posted @ 2017-12-11 09:23 caiqingfei 阅读(249) 评论(0) 推荐(0)
摘要:在开发过程中,有时我们需要执行多条SQL语句,那如何处理才能解决这样的问题? 1,多条语句执行错误 原因:试图用一个PreparedStatement对象,执行多次SQL操作。程序会提示一下错误: Operation not allowed after ResultSet closed 因为在执行w 阅读全文
posted @ 2017-12-09 21:49 caiqingfei 阅读(17507) 评论(1) 推荐(0)
摘要:待续:https://www.zhihu.com/question/21429785/answer/147047565 阅读全文
posted @ 2017-12-07 17:19 caiqingfei 阅读(340) 评论(0) 推荐(0)
摘要:在实际开发中,我们经常会使用随机函数,比如交叉验证,构造测试数据等。下面,是我常用的几个生成随机样本的函数: 1,rand(n1,n2,…,nn) 每一维度都是[0.0,1.0)半闭半开区间上的随机分布 2,randn(n1,n2,…,nn) 返回一个样本,具有标准正态分布 3,random([si 阅读全文
posted @ 2017-12-07 09:50 caiqingfei 阅读(1258) 评论(0) 推荐(0)
摘要:一、random模块简介 Python标准库中的random函数,可以生成随机浮点数、整数、字符串,甚至帮助你随机选择列表序列中的一个元素,打乱一组数据等。 二、random模块重要函数 1 )、random() 返回0<=n<1之间的随机实数n;2 )、choice(seq) 从序列seq中返回随 阅读全文
posted @ 2017-12-02 20:06 caiqingfei 阅读(9904) 评论(0) 推荐(1)
摘要:转自:http://www.jianshu.com/p/6e18d21a4cad 阅读全文
posted @ 2017-12-02 18:59 caiqingfei 阅读(694) 评论(0) 推荐(0)
摘要:转自:https://www.cnblogs.com/zhizhan/p/5615947.html Python--matplotlib绘图可视化知识点整理 强烈推荐ipython 原文:http://michaelxiang.me/2016/05/14/python-matplotlib-basi 阅读全文
posted @ 2017-12-01 23:15 caiqingfei 阅读(1879) 评论(1) 推荐(1)
摘要:参考博客:https://www.cnblogs.com/nolonely/p/6944150.html python3使用matplotlib画图,因python3默认使用中unicode编码,所以在写代码时不再需要写 plt.xlabel(u'周次'),而是直接写plt.xlabel(‘周次’) 阅读全文
posted @ 2017-12-01 22:56 caiqingfei 阅读(1117) 评论(0) 推荐(0)
摘要:参考博客:http://blog.csdn.net/u013930163/article/details/51839983 网站:https://docs.scipy.org/doc/numpy-dev/user/quickstart.html 阅读全文
posted @ 2017-12-01 10:56 caiqingfei 阅读(235) 评论(0) 推荐(0)