摘要:本人菜鸟,对天池数据写点小理解。天池数据不同于一般的评分数据,有几点比较主要:天池数据存在同用户对同物品的不同操作,这和SVD相背,所以数据处理这块非常重要。又根据啊里的背景来看,会发现数据存在这样一个内部关系。购买的物品必然受到点击到购物车,那么这个时候购物车的分析意义有多大?值得商榷。同时那么多的点击次数是因为对找个商品有购买欲望?还是因为购买过来看看价格波动?同时淘宝的数据存在这样一个问题,例如我买的小零食可以出现多次购买,但是购买例如电脑、冰箱这种大物件基本存在二次购买的几率比较小。而数据经过加密处理,这种情况怎么考虑?等等。其这篇文章主要还是一贯作风,贴代码,留个纪念。效果不是很好,
阅读全文
摘要:最近想整整推荐系统,比较经典的算法就是SVD了。具体理论不多讲了。直接上代码。先贴张效果图吧。userNum 6040 itemNum 3900本文链接:http://www.cnblogs.com/wn19910213/p/3617781.html上代码咯:SVD.h 1 #ifndef SVD_H_INCLUDED 2 #define SVD_H_INCLUDED 3 4 #include 5 #include 6 7 using namespace std; 8 9 class SVD{10 public:11 SVD(double*,double*,i...
阅读全文
摘要:矩阵分解是最近几年比较火的算法,经过kddcup和netflix比赛的多人多次检验,矩阵分解可以带来更好的结果,而且可以充分地考虑各种因素的影响,有非常好的扩展性,因为要考虑多种因素的综合作用,往往需要构造cost function来将矩阵分解问题转化为优化问题,根据要考虑的因素为优化问题添加constraints,然后通过迭代的方法进行矩阵分解,原来评分矩阵中的missing vlaue可以通过分解后得到的矩阵求的。本文将简单介绍下最近学习到的矩阵分解方法。(1)PureSvd怎么评价这种方法呢?开始觉得这种方法很神奇很数学,而且在实际使用的时候也非常好用。但最近读了Yehuda大神的pap
阅读全文
摘要:import java.io.*;import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;public class read1 { public static void main(String[] args) throws IOException{ String file = "/home/ja/CADATA/mushroom_fp_threshold50.1"; FileReader fr = new FileReader(n...
阅读全文
摘要:#include#include#include#include#include#include#include#include#includeusing namespace std;const int ITERM_SIZE=1682;const int USER_SIZE=943;const int V=15; //ITERM的最近邻居数const int S=10; //USER的最近邻居数struct MyPair{ int id; double value; MyPair(int i=0,double v=0):id(i),value(v)...
阅读全文
摘要:学习吧,总会有厌倦期,EM算法就不自己写了,转帖一个源码,可运行,个人不喜欢算法的图形界面,所以这个算法也没怎么研究,但是可运行。转载的最初链接无从查起,如有侵权,请与我联系,带来不便,敬请谅解。不多啰嗦,直接上源码(个人感觉EM算法的高斯混合模型好难- -、) 1 import java.awt.Dimension; 2 import java.awt.EventQueue; 3 import java.awt.Toolkit; 4 import java.awt.event.ActionEvent; 5 import java.awt.event.ActionListener; ...
阅读全文
摘要:由于对AdaBoost算法的弱分类器不是很了解,没明白算法描述里的“在权值分布的训练集上,取阈值使得分类误差率最小,然后就得到基本分类器”这句话。不是很明白怎么根据权值分布得到的阈值?提供的代码是直接给出了弱分类器,不知道是不是这样,有问题请提出,谢谢。一起学习。由于被弱分类器搞的郁闷,所以代码中没有添加注释,但是步骤1.2.3是根据李航的算法描述1.2.3进行编写的。 1 import java.util.ArrayList; 2 import java.util.List; 3 4 public class AdaBoost { 5 public static void...
阅读全文
摘要:原文来自:博客园(华夏35度)http://www.cnblogs.com/zhangchaoyang作者:Orisun先上问题吧,我们统计了14天的气象数据(指标包括outlook,temperature,humidity,windy),并已知这些天气是否打球(play)。如果给出新一天的气象指标数据:sunny,cool,high,TRUE,判断一下会不会去打球。table 1outlooktemperaturehumiditywindyplaysunnyhothighFALSEnosunnyhothighTRUEnoovercasthothighFALSEyesrainymildhigh
阅读全文
摘要:由于在网上找的bayes的源码都是基于应用的,本人才疏学浅,看不太懂,自己花了2天时间写了个粗糙的代码(基于李航那本书的例子),由于只是初学,若有错误,请指出,大家一起学习! 1 import java.io.BufferedReader; 2 import java.io.File; 3 import java.io.FileNotFoundException; 4 import java.io.FileReader; 5 import java.io.IOException; 6 import java.util.ArrayList; 7 import java.util.H...
阅读全文
摘要:由于看网上的java有点多,自己写了一份,本人也是初学者,有错误请提出,大家一起学习。 1 import java.io.BufferedReader; 2 import java.io.File; 3 import java.io.FileNotFoundException; 4 import java.io.FileReader; 5 import java.io.IOException; 6 import java.util.*; 7 8 9 public class Index {10 public static void main(String[] args){11 ...
阅读全文
摘要:由于本人也是初学者,有错误请各位提出,大家一起学习。原始形式代码: 1 package perceptron; 2 3 public class yuanshi { 4 public static void main(String[] args){ 5 int[][ ]x = {{3,3,1},{4,3,1},{1,1,-1}}; 6 int[] w = {0,0}; 7 select(x,w,0); 8 } 9 10 private static void select(int[][] x, int[] w, int ...
阅读全文