摘要: 文本挖掘,内容挖掘,使用挖掘WEB日志7个字段:第一项:远程主机的地址。第二项:浏览器的EMAIL的地址或其他唯一标识符。没有用email就用(-)代替。第三项:记录浏览者尽量身份验证时提供的名字,一般为-;(就像学校实验指导书网站)第4项:请求的时间。 第5项:告诉服务器收到的一个什么样的请求(m... 阅读全文
posted @ 2015-04-28 23:44 nskl 阅读(109) 评论(0) 推荐(0)
摘要: 聚类分析的基于内存的数据结构:1二模矩阵:用P个变量来表示N个对象。(行表示属性,列表示每个对象对每个属性的特征)行和列都表示不同的实体2异度矩阵:行和列表示相同的实体;(单模矩阵)存储n个对象两两之间的近似。区间标度变量:重量、高度。一个粗略线性标度的连续度量。度量单位将直接影响聚类分析的结构,需... 阅读全文
posted @ 2015-04-28 22:49 nskl 阅读(329) 评论(0) 推荐(0)