2015年11月13日

LSA算法简单理解

摘要: 文本挖掘的两个方面应用:(1)分类:a.将词汇表中的字词按意思归类(比如将各种体育运动的名称都归成一类)b.将文本按主题归类(比如将所有介绍足球的新闻归到体育类)(2)检索:用户提出提问式(通常由若干个反映文本主题的词汇组成),然后系统在数据库中进行提问式和预存的文本关键词的自动匹配工作,两者相符的... 阅读全文

posted @ 2015-11-13 02:25 固执的淡水鱼 阅读(4878) 评论(0) 推荐(0) 编辑

数据挖掘中的离群点检测

摘要: 离群点的定义:离群点是一个数据对象,它显著不同于其他数据对象,好像它是被不同的机制产生一样。离群点的来源:(1)客体的异常行为导致,如欺诈、入侵、不寻常的实验结果(2)数据测量和收集误差(3)数据变量内在特性引起,如顾客新的购买模式、基因突变等 离群点检测的必要性:(1)去除某些异常数据(2)“一个... 阅读全文

posted @ 2015-11-13 01:52 固执的淡水鱼 阅读(1508) 评论(0) 推荐(0) 编辑

导航