标签集

05 2011 档案

数据挖掘算法计算量大的论据
摘要:目前用于短信自动分类的机器学习方法主要有朴素贝叶斯[10]、SVM[11]、KNN[12][13]、人工神经网络算法[14]等。基于内容的垃圾短信过滤与基于关键词的垃圾短信过滤相比,其运算量更大。 阅读全文

posted @ 2011-05-30 17:35 宋亚奇 阅读(318) 评论(0) 推荐(0)

云计算的优势(传统平台的问题)
摘要:1。并行化 ,计算速度快2。能够处理的数据规模大3。具体编程实现:由于在云计算平台上不用再考虑线程之间的同步、互斥、并发等问题,使系统设计实现较为容易。4。系统扩展:在云计算平台上增加新的机器即可实现系统扩展,而传统并行系统扩展则相对麻烦。 阅读全文

posted @ 2011-05-30 17:29 宋亚奇 阅读(360) 评论(0) 推荐(0)

作科研的方法
摘要:很多人作科研,进展缓慢,在进行汇报,比如开题或者中期的时候,所述内容空洞、笼统,就像项目申请书一样。造成这种情况的主要原因在于研究者浮于研究对象的表面,不肯深入进去探索。读者可以自己来评判自己的研究深度,就是以研究的对象——客体来评价。可以自己发问:你现在研究的问题是什么?如果答案是在某个具体的工程应用,如:如何将某种数据进行hadoop的存储,以完成数据处理?那么这个人的研究一定是刚刚开始。如果提出的问题并不具体于某个应用,而是这个问题如果解决了,可以应用于多种具体应用,那么这个研究就相对较深入了,就钻进去了,就好发文章了。 阅读全文

posted @ 2011-05-16 10:03 宋亚奇 阅读(223) 评论(0) 推荐(0)

数据挖掘与专家系统的区别
摘要:专家系统里装的是专家的知识;这里专家知识的获取与表达是专家系统的瓶颈;数据挖掘系统里装的知识普通数据;希望从其中挖出知识; 阅读全文

posted @ 2011-05-16 08:38 宋亚奇 阅读(454) 评论(0) 推荐(0)

导航