上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 18 下一页
摘要: 这篇文章主要是一个闲文。如果您正在寻求一个理想的随机排列生成算法,直接阅读方法3,或是直接使用STL里提供的random_shuffle()方法另外请注意,这里所讨论的算法并不是新的。什么是随机排列? 一个随机排列是一组位于随机位置的对象。给定一个对象,1, 2, 3 ... n,随机排列看起来就是 阅读全文
posted @ 2016-08-03 09:38 夕月一弯 阅读(2101) 评论(0) 推荐(0)
摘要: 1.概述 跟SimHash一样,MinHash也是LSH的一种,可以用来快速估算两个集合的相似度。MinHash由Andrei Broder提出,最初用于在搜索引擎中检测重复网页。它也可以应用于大规模聚类问题。 2.Jaccard index 在介绍MinHash之前,我们先介绍下Jaccard i 阅读全文
posted @ 2016-08-03 09:37 夕月一弯 阅读(1570) 评论(0) 推荐(0)
摘要: 我们知道,通过对数组进行直接寻址(Direct Addressing),可以在 O(1) 时间内访问数组中的任意元素。所以,如果存储空间允许,可以提供一个数组,为每个可能的关键字保留一个位置,就可以应用直接寻址技术。 哈希表(Hash Table)是普通数组概念的推广。当实际存储的的关键字数比可能的 阅读全文
posted @ 2016-08-03 09:36 夕月一弯 阅读(10311) 评论(0) 推荐(1)
摘要: P问题、NP问题和NPC问题 这或许是众多OIer最大的误区之一。 先简单总结:P类问题就是在多项式时间内可以计算求解的问题。NP类问题就是在多项式时间内可以计算猜测解的问题。 你会经常看到网上出现“这怎么做,这不是NP问题吗”、“这个只有搜了,这已经被证明是NP问题了”之类的话。你要知道,大多数人 阅读全文
posted @ 2016-05-21 11:42 夕月一弯 阅读(272) 评论(0) 推荐(0)
摘要: 从贝叶斯方法谈到贝叶斯网络 转自:http://blog.csdn.net/v_july_v/article/details/40984699 作者:v_JULY_v 0 引言 事实上,介绍贝叶斯定理、贝叶斯方法、贝叶斯推断的资料、书籍不少,比如《数理统计学简史》,以及《统计决策论及贝叶斯分析 Ja 阅读全文
posted @ 2016-05-18 20:59 夕月一弯 阅读(1540) 评论(0) 推荐(0)
摘要: 训练集(train set) 验证集(validation set) 测试集(test set) 阅读全文
posted @ 2016-04-06 22:17 夕月一弯 阅读(828) 评论(0) 推荐(0)
摘要: Python下科学计算包numpy和SciPy的安装 阅读全文
posted @ 2016-04-04 20:30 夕月一弯 阅读(491) 评论(0) 推荐(0)
摘要: Cannot use ImageField because Pillow is not installed. HINT: Get Pillow at https://pypi.python.org/pypi/Pillow or run command "pip install pill... 阅读全文
posted @ 2015-12-30 14:30 夕月一弯 阅读(849) 评论(0) 推荐(1)
摘要: rapidminer 数据导入及几个算子简单应用 一、 数据集选择 本次实验选择的数据集为: bank-data.csv 其中有600条数据 结构如下图: 二、数据集文件格式转换 Rapidminer 支持的导入数据格式有如下图所示: 所以我们需要把下载的数据集文件格式进行转换,由于本次实验下载的文 阅读全文
posted @ 2015-12-16 15:33 夕月一弯 阅读(1245) 评论(0) 推荐(0)
上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 18 下一页