04 2016 档案

摘要:用官方的话来说,所谓K近邻算法(k-Nearest Neighbor,KNN),即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居), 这K个实例的多数属于某个类,就把该输入实例分类到这个类中。这是一个有监督的学习算法 例如下图,红色和蓝色代 阅读全文
posted @ 2016-04-27 17:43 2BiTT 阅读(257) 评论(0) 推荐(0)
摘要:k-means是一种无监督学习算法,用于聚类。 下图(来自http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006910.html)展示了k-means算法k=2时的聚类过程。 第一步:给定k个中心点,然后依次遍历所有数据点,计算每个数据点到k 阅读全文
posted @ 2016-04-27 17:35 2BiTT 阅读(435) 评论(0) 推荐(0)
摘要:在数据分析或者数据挖掘的时候,经常碰到回归和分类的问题,下面详细说下我对我这两概念的理解。 回归 一直对为什么叫回归很好奇,百度百科对回归的定义如下: 回归,指研究一组随机变量(Y1 ,Y2 ,…,Yi)和另一组(X1,X2,…,Xk)变量之间关系的统计分析方法,又称多重回归分析。通常Y1,Y2,… 阅读全文
posted @ 2016-04-25 16:27 2BiTT 阅读(1484) 评论(0) 推荐(1)
摘要:今天把之前的一些代码转移到另外一台电脑的时候, python manage.py syncdb 的时候报了 (1366, "Incorrect string value: '\\xE6\\x88\\x9A\\xE4\\xBC\\x9F...' 的错误,查了一下,应该是数据库编码设置的问题,看了一下本 阅读全文
posted @ 2016-04-17 12:08 2BiTT 阅读(2549) 评论(1) 推荐(1)
摘要:参数解析: -j:使用-j才能使用-f -n:默认情况下,如果定时进程正在运行,date命令会在本地组的所有机器设置时间。 -n选项可以禁止这种行为,表示只设置当前计算机。 -u:显示或设置日期为UTC时间。 -d:设置内核的时区,一般不用 -r:秒转换时间 -t:(time zone)设置一GMT 阅读全文
posted @ 2016-04-15 18:05 2BiTT 阅读(23969) 评论(0) 推荐(2)