摘要:旅行商问题,简单地说,即一个商人要找一条通过n个城市的最短巡回。 开始产生的随机路径: 遗传算法的其中一个结果 对个体采用字符编码的方式。如[3,1,4,2,5]表示开始从第3个结点开始,然后第1个结点,依次而行。为了避免产生非法解,对个体进行变因时,实质是交换个体中的两个数字的位置。例如[4...
阅读全文
摘要:假设从向银行申请贷款的顾户中,要选出优质顾客。怎么做? 现在有学习数据如下 ID 孩子个数 薪水 婚姻状况 是否优质顾客? ID-1 2 45000 Married 0 ID-2 ...
阅读全文
摘要:关联规则的目的在于在一个数据集中找出项之间的关系,也称之为购物蓝分析 (market basket analysis)。例如,购买鞋的顾客,有10%的可能也会买袜子,60%的买面包的顾客,也会买牛奶。这其中最有名的例子就是"尿布和啤酒"的故事了。 关联规则的应用场合。在商业销售上,关联规则可用于交叉...
阅读全文
摘要:在SQL中经常需要计算数据的趋势,如下表中,ID为123在1-5月的通话费。现在要预测6月份的通话费或者说需要观察它的变化趋势。对于这些数据使用回归分析 ,如果得到的直线的斜率大于零,则其话费呈增长的趋势;如果直线的斜率小于零,则这5个月的话费呈减小的趋势。 ...
阅读全文
摘要:包e1071提供了对libsvm的接口。库libsvm包括了常用的核,如线性,多项式,RBF,sigmoid等。多分类通过一对一的投票机制(one-against-one voting scheme)而实现。predict()是训练函数,plot()可视化数据,支持向量,决策边界(如果提供的话)。...
阅读全文
摘要:包里函数ksvm()通过.Call接口,使用bsvm和libsvm库中的优化方法,得以实现svm算法。对于分类,有C-SVM分类算法和v-SVM分类算法,同时还包括C分类器的有界约束的版本。对于回归,提供了ε-SVM回归算法和v-SVM回归算法。对于多类分类,有一对一(one-against-one...
阅读全文
摘要:1. 线性SVM 假设有分布在Rd空间中的数据,我们希望能够在该空间上找出一个超平面(Hyper-pan),将这一数据分成两类。属于这一类的数据均在超平面的同侧,而属于另一类的数据均在超平面的另一侧。如下图。 比较上图,我们可以发现左图所找出的超平面(虚线),其两平行且与两类数据相切...
阅读全文
摘要:〈集体智慧编程〉(即 Programming Collective Intelligence: Building Smart Web 2.0 Applications )还没读完,Collective Intelligence in Action又来了。事实上,这本书目前在日本的书泉等书店也是作为计...
阅读全文
摘要:能用office07发布简直是太好了,这下子省了很多事。 1、多元线性回归模型 假定被解释变量与多个解释变量之间具有线性关系,是解释变量的多元线性函数,称为多元线性回归模型。即 (1.1) 其中为被解释变量,为个解释变量,为个未知参数,为随机误差项。 被解释变量的期望值与解释变量的线性...
阅读全文