上一页 1 2 3 4 5 6 7 8 9 ··· 13 下一页
摘要: 最近在做聚类的时候用到了主成分分析PCA技术,里面涉及一些关于矩阵特征值和特征向量的内容,在网上找到一篇对特征向量及其物理意义说明较好的文章,整理下来,分享一下。 阅读全文
posted @ 2013-07-04 17:50 ChaoSimple 阅读(20687) 评论(1) 推荐(3) 编辑
摘要: 以前写文章的时候忽略了在文章中添加参考文献及其引用的方式,文章各式显得不太正式,在网上进行了相关搜索,将方法整理如下... 阅读全文
posted @ 2013-07-04 11:31 ChaoSimple 阅读(136638) 评论(0) 推荐(0) 编辑
摘要: 本文详细描述了DBSCAN聚类算法的核心概念定义、聚类过程以及算法描述等内容。 阅读全文
posted @ 2013-07-01 13:52 ChaoSimple 阅读(97733) 评论(3) 推荐(7) 编辑
摘要: 本文详细介绍了余弦距离和杰卡德相似度、杰卡德距离的计算方法,对比分析了余弦距离和欧氏距离的差异以及适用范围。在分析杰卡德相似度的计算过程中,引入非对称二元变量的概念,解释了杰卡德相似度的计算特点及其原因。最后给出了调整余弦相似度的一种简单算法。 阅读全文
posted @ 2013-06-28 14:47 ChaoSimple 阅读(139335) 评论(3) 推荐(6) 编辑
摘要: 本文从一个实例(如何获取《中国的蜜蜂养殖》这篇文章的关键词)出发,详细的描述了TF-IDF算法的思路和计算过程,讲解了该算法的应用途径,最后分析了该算法的不足之处。 阅读全文
posted @ 2013-06-27 17:22 ChaoSimple 阅读(1524) 评论(0) 推荐(1) 编辑
摘要: 网上看到一张讲解Google工作原理的图,与大家分享一下: 阅读全文
posted @ 2013-06-27 14:17 ChaoSimple 阅读(752) 评论(0) 推荐(0) 编辑
摘要: [] 是针对特定类型、固定长度的。 List 是针对特定类型、任意长度的。 Array 是针对任意类型、固定长度的。 ArrayList 是针对任意类型、任意长度的。 Array 和 ArrayList 是通过存储 object 实现任意类型的,所以使用时要转换。 参考: http://www.cftea.com/c/2008/10/XNW6ZR0WXNGK6B9X.asp 阅读全文
posted @ 2013-06-24 15:05 ChaoSimple 阅读(736) 评论(0) 推荐(0) 编辑
摘要: 随着数据收集和存储技术的发展,收集大量缺少标记的数据已相当容易,而为这些数据提供标记则相对困难,因为数据标记过程往往需要消耗大量人力物力,甚至必须依赖于少数领域专家来完成。例如在计算机辅助诊断中,可以方便地从医院日常体检中获取训练数据,但是让医学权威专家为所有的体检结果提供诊断往往是不现实的。事实上,在实际应用中,大量未标记数据和少量有标记数据并存的情况比比皆是。然而,由于能用于监督学习的有标记样本较少,通常难以学得泛化能力强的模型。因此,如何利用大量未标记数据来帮助提升在少量有标记数据上学得模型的泛化能力,成了当前机器学习领域倍受关注的重要问题之一。 阅读全文
posted @ 2013-06-21 12:00 ChaoSimple 阅读(3629) 评论(0) 推荐(1) 编辑
摘要: 本文将详细介绍数据结构中的一些常用的搜索树结构,包括:B树、B-树、B+树、B*树;分别介绍这些树结构的定义、特征、搜索方法、性能等情况,最后给出了一个简要的总结。 阅读全文
posted @ 2013-06-12 11:10 ChaoSimple 阅读(1716) 评论(0) 推荐(0) 编辑
摘要: 本文使用图例的方式详细描述了UML中几种常用的关系:泛化、实现、关联、聚合、组合、依赖,并详细对比了各种关系之间的强弱顺序,最后给出了一个完整的UML各种关系图例。 阅读全文
posted @ 2013-06-11 17:28 ChaoSimple 阅读(616) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 13 下一页