随笔分类 -  python

studying
摘要:Took 0.152364 seconds Took 0.061580 seconds Took 1.016529 seconds Took 0.215403 seconds 阅读全文
posted @ 2018-12-12 09:37 mrbean 阅读(3581) 评论(0) 推荐(0)
摘要:另:python 3的open函数可以直接加encoding参数 阅读全文
posted @ 2017-01-23 13:09 mrbean 阅读(332) 评论(0) 推荐(0)
摘要:python的sort函数使用的时候有一个参数 。一定注意这里返回值要用1和 1。不能True和False!!! 阅读全文
posted @ 2016-11-20 00:41 mrbean 阅读(352) 评论(0) 推荐(0)
摘要:问题的定义: 首先我们有一个数据是一个m n的numpy矩阵现在我们希望能够进行给他加上一列变成一个m (n+1)的矩阵 import numpy as np a = np.array([[1,2,3],[4,5,6],[7,8,9]]) b = np.ones(3) c = np.... 阅读全文
posted @ 2015-09-20 15:07 mrbean 阅读(41781) 评论(0) 推荐(2)
摘要:![](http://images0.cnblogs.com/blog2015/561813/201505/281120453768566.png)图片来自sklearn官网最近事情弄完一部分了,继续开始python data science! 阅读全文
posted @ 2015-05-28 11:22 mrbean 阅读(1457) 评论(0) 推荐(0)
摘要:#感知机(perceptron)##模型:简答的说由输入空间(特征空间)到输出空间的如下函数:$$f(x)=sign(w\cdot x+b)$$称为感知机,其中,$w$和$b$表示的是感知机模型参数,$w \in R^n$叫做权值,$b \in R$叫做偏置(bias)感知机是一种线性分类模型属于判... 阅读全文
posted @ 2015-04-15 14:24 mrbean 阅读(8949) 评论(0) 推荐(1)
摘要:最近因为想要看漫画,无奈下载的漫画是jpg的格式,网上的转换器还没一个好用的,于是乎就打算用python自己DIY一下:这里主要用了reportlab。开始打算随便写几行,结果为若干坑纠结了挺久,于是乎就想想干脆把代码写好点吧。#实现了以下的几项功能:* 将当前文件夹下的图片保存到一个pdf中,支持... 阅读全文
posted @ 2015-01-30 00:09 mrbean 阅读(2410) 评论(2) 推荐(4)
摘要:![居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不让发居然不... 阅读全文
posted @ 2015-01-24 17:32 mrbean 阅读(727) 评论(0) 推荐(0)
摘要:首先用Anaconda是因为方便(管理方便,包安装真心不方便)。下面是我的安装过程:首先使用如下命令安装opencvconda install -c https://conda.binstar.org/menpo opencv不过装完之后用不了,这时候找到如下文件夹Anaconda\pkgs\ope... 阅读全文
posted @ 2015-01-24 14:58 mrbean 阅读(26225) 评论(0) 推荐(0)
摘要:解决方法:这个貌似是属于一个bug把Image.py中的1500行左右的split函数改成如下即可: def split(self): "Split image into bands" self.load() if self.im.bands == 1... 阅读全文
posted @ 2015-01-16 14:49 mrbean 阅读(1235) 评论(0) 推荐(0)
摘要:找到PIL安装文件里的ImageShow.py把第99行的 return "start /wait %s && del /f %s" % (file, file) 修改成 return "start /wait %s && PING 127.0.0.1 -n 5 > NUL && del... 阅读全文
posted @ 2015-01-14 18:13 mrbean 阅读(522) 评论(0) 推荐(0)
摘要:协同过滤(collaborative filtering)推荐系统:百度百科的定义是:它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程主要有有以下几种推荐的方式:基于内容的推荐协同过滤关联推荐混合推荐协同过滤这里我们主要考虑的是协同过滤,这... 阅读全文
posted @ 2014-12-13 00:12 mrbean 阅读(3903) 评论(0) 推荐(1)
摘要:SVD(Singular Value Decomposition,奇异值分解)算法优缺点:优点:简化数据,去除噪声,提高算法结果缺点:数据的转换可能难于理解适用数据类型:数值型数据算法思想:很多情况下,数据的一小部分包含了数据的绝大部分信息,线性代数中有很多矩阵的分解技术可以将矩阵表示成新的易于处理... 阅读全文
posted @ 2014-12-12 00:06 mrbean 阅读(7662) 评论(0) 推荐(0)
摘要:Principal Component Analysis算法优缺点:优点:降低数据复杂性,识别最重要的多个特征缺点:不一定需要,且可能损失有用的信息适用数据类型:数值型数据算法思想:降维的好处:使得数据集更易使用降低很多算法计算开销去除噪声使得结果易懂主成分分析(principal componen... 阅读全文
posted @ 2014-12-10 23:25 mrbean 阅读(2759) 评论(3) 推荐(0)
摘要:FP-growth算法优缺点:优点:一般快于Apriori缺点:实现比较困难,在某些数据上性能下降适用数据类型:标称型数据算法思想:FP-growth算法是用来解决频繁项集发现问题的,这个问题再前面我们可以通过Apriori算法来解决,但是虽然利用Apriori原理加快了速度,仍旧是效率比较低的。F... 阅读全文
posted @ 2014-12-09 23:55 mrbean 阅读(3514) 评论(0) 推荐(2)
摘要:Apriori算法优点:易编码实现缺点:在大数据集上可能较慢适用数据类型:数值型或者标称型算法过程:关联分析是一种在大规模数据集中寻找有意思的关系的任务,这里的有意思的关系有两种:频繁项集(frequent item sets)或关联规则(association rules)。支持度(support... 阅读全文
posted @ 2014-12-08 00:27 mrbean 阅读(4756) 评论(0) 推荐(3)
摘要:线性回归算法优缺点:优点:结果易于理解,计算不复杂缺点:对非线性数据拟合不好适用数据类型:数值型和标称型算法思想:这里是采用了最小二乘法计算(证明比较冗长略去)。这种方式的优点是计算简单,但是要求数据矩阵X满秩,并且当数据维数较高时计算很慢;这时候我们应该考虑使用梯度下降法或者是随机梯度下降(同Lo... 阅读全文
posted @ 2014-12-05 23:56 mrbean 阅读(11417) 评论(0) 推荐(1)
摘要:AdaBoost(自适应boosting,adaptive boosting)算法算法优缺点:优点:泛化错误率低,易编码,可用在绝大部分分类器上,无参数调整缺点:对离群点敏感适用数据类型:数值型和标称型元算法(meta algorithm)在分类问题中,我们可能不会只想用一个分类器,我们会考虑将分类... 阅读全文
posted @ 2014-12-04 00:26 mrbean 阅读(4776) 评论(1) 推荐(2)
摘要:二分K-means聚类(bisecting K-means)算法优缺点:由于这个是K-means的改进算法,所以优缺点与之相同。算法思想:1.要了解这个首先应该了解K-means算法,可以看这里这个算法的思想是:首先将所有点作为一个簇,然后将该簇一分为二。之后选择能最大程度降低聚类代价函数(也就是误... 阅读全文
posted @ 2014-11-29 00:33 mrbean 阅读(12132) 评论(0) 推荐(4)
摘要:K-means聚类算法算法优缺点:优点:容易实现缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢使用数据类型:数值型数据算法思想k-means算法实际上就是通过计算不同样本间的距离来判断他们的相近关系的,相近的就会放到同一个类别中去。1.首先我们需要选择一个k值,也就是我们希望把数据分成多少类,... 阅读全文
posted @ 2014-11-28 00:53 mrbean 阅读(72284) 评论(8) 推荐(6)