摘要: 最近在做数据挖掘应该说是入门的一个小实验,就是预测用户对电影的打分的一个推荐算法。感觉到处理数据是一件特别麻烦的事情,特别是漫长的等待时间,已经尽可能的构造出记录最少的用户相似性矩阵或者电影的相似性矩阵(我用了特别偷懒的做法,存放在数据库里面实现),因为都用到数据库,所以免去了写一些关于数据结构的操作,自己也很疑惑,到底数据挖掘过程的这些数据,一般是存放数据库进行操作还是直接在内存上面进行一次性操作处理的?问了老师,老师也只是说根据实际情况。的确,存放数据库免去了很大的工作量,数据库本来就是一个很完美的数据结构了,少去了查找的麻烦,少去了hash操作的麻烦,只要写sql语句就够了,但是在做好C 阅读全文
posted @ 2011-11-22 00:24 Leeforall 阅读(117) 评论(0) 推荐(0)