随笔分类 -  算法

摘要:最直白方法:时间复杂度是O(n3), 空间复杂度是常数reference:http://blog.csdn.net/monkeyandy/article/details/7957263/**** copyright@andy**http://blog.csdn.net/MonkeyAndy**/首先... 阅读全文
posted @ 2014-10-14 16:53 vivianC 阅读(771) 评论(0) 推荐(0)
摘要:url pattern mining within same domain site 阅读全文
posted @ 2014-10-10 17:20 vivianC 阅读(157) 评论(0) 推荐(0)
摘要:http://www.spongeliu.com/399.htmlhttp://in.sdo.com/?p=865 阅读全文
posted @ 2014-10-10 17:19 vivianC 阅读(567) 评论(0) 推荐(0)
摘要:1.算法收敛,收敛与发散对应,收敛是指迭代若干次之后,目标量收敛曲线趋于平稳,趋于定值,而发散是无论迭代次数多大,收敛曲线均一直跳动无法趋于定值。2.收敛能不能求得最优解?能否收敛到最优解,分为局部最优和全局最优,主要看你的目标函数的性质,是多峰还是单峰,跟初值的选择也有关系 阅读全文
posted @ 2014-09-25 09:02 vivianC 阅读(1391) 评论(0) 推荐(0)
摘要:http://www.jjj.de/fxt/fxtpage.html 阅读全文
posted @ 2012-12-24 17:29 vivianC 阅读(119) 评论(0) 推荐(0)
摘要:http://www.guzili.com/?p=45204写在最前:本专题经 @老师木 同意, 特收录“老湿”对AI/ML的一些独到见解。如果非要问我为什么要特别收录这几篇文章,回答:个人认为,他的大部分见解已经并肩甚至超过了该领域的一般教授。如果你再八卦一下问这个专题为什么叫“褪去华衣 裸视学习”,答曰:这些见解一定程度上褪去了AI/ML的神秘色彩,可以让我们更客观的看待这一学科。专题分为:1)机器学习 基础篇褪去华衣 裸视学习 之 机器学习教材褪去华衣 裸视学习 之 高斯分布褪去华衣 裸视学习 之 sigmod函数褪去华衣 裸视学习 之 关于‘基’2)机器学习 进阶篇褪去华衣 裸视学习 阅读全文
posted @ 2012-12-08 19:27 vivianC 阅读(315) 评论(0) 推荐(0)
摘要:http://www.cnblogs.com/sing1ee/archive/2012/11/18/2776178.html我一直在做社交网络的挖掘工作,深感目前的一些技术并不能满足社交挖掘的需要。我并没有用过太多的工具,而且图计算的平台也没有用过,涉及到大规模数据的离线分析,主要是依赖hadoop。不过,这并不妨碍,我从挖掘需求的角度来探讨:社交挖掘到底需要哪些技术基础,需要一些什么样的工具。题目中有一个词:large graph。也有很多人认为是big graph。我之所以改变称谓,主要的原因在我前面的博客中有体现。因为big data中的个体之间,往往具有关系,这个样就组成了一个grap 阅读全文
posted @ 2012-11-25 17:35 vivianC 阅读(231) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2012-11-16 11:10 vivianC 阅读(228) 评论(0) 推荐(0)
摘要:http://www.autonlab.org/tutorials/ 阅读全文
posted @ 2012-10-15 12:28 vivianC 阅读(144) 评论(0) 推荐(0)
只有注册用户登录后才能阅读该文。
posted @ 2012-09-10 13:25 vivianC 阅读(12) 评论(0) 推荐(0)
摘要:http://www.stanford.edu/class/cs246/handouts.htmlMining Massive Data Sets 阅读全文
posted @ 2012-09-05 11:38 vivianC 阅读(256) 评论(0) 推荐(0)
摘要:1.聊一聊跳表作者的其人其事2. 言归正传,跳表简介3. 跳表数据存储模型4. 跳表的代码实现分析5. 论文,代码下载及参考资料<1>. 聊一聊作者的其人其事跳表是由William Pugh发明。他在 Communications of the ACM June 1990, 33(6) 668-676 发表了Skip lists: a probabilistic alternative to balanced trees,在该论文中详细解释了跳表的数据结构和插入删除操作。William Pugh同时还是FindBug(没有使用过,这是一款java的静态代码分析工具,直接对java 阅读全文
posted @ 2012-08-31 20:22 vivianC 阅读(178) 评论(0) 推荐(0)
摘要:分布式哈希和一致性哈希分布式哈希和一致性哈希是分布式存储和p2p网络中说的比较多的两个概念了。介绍的论文很多,这里做一个入门性质的介绍。分布式哈希(DHT) 两个key point:每个节点只维护一部分路由;每个节点只存储一部分数据。从而实现整个网络中的寻址和存储。 DHT只是一个概念,提出了这样一种网络模型。并且说明它是对分布式存储很有好处的。但具体怎么实现,并不是DHT的范畴。一致性哈希: DHT的一种实现。本质还是一个哈希算法。回想平时我们做负载均衡,按querystring签名对后端节点取模是最简单也是最常用的算法,但节点的增删后所造成的问题显而易见,原有的请求几乎都落不到同一台机器上 阅读全文
posted @ 2012-08-20 20:34 vivianC 阅读(234) 评论(0) 推荐(0)
摘要:二叉树:一个根节点,每个节点下挂着最多2个子节点。、概念:度:结点的分支数,二叉树度为2。深度:树的层次。二叉排序树:二叉树的基础上,每个节点上都有一个数字,节点上的数字都比右节点上的大。应用场景:基于内存的排序数据结构,写入时将数据写入到对应的位置。数据可能会出现倾斜,可以想到数字写入顺序如果不是50-20-60-18-55,而是18-20-50-55-60,那么二叉树就会退变为链表。B-树:B-树每个节点上包含着数据和指针,每个指针指向其一个子节点的位置,并且数据的个数为指针的2d-1个。这里的d是指针的个数,同时也是树的“度”。B-树的查找需要一次对每个节点进行二分查找,直至找到或返回n 阅读全文
posted @ 2012-08-20 19:16 vivianC 阅读(148) 评论(0) 推荐(0)
只有注册用户登录后才能阅读该文。
posted @ 2012-06-16 11:50 vivianC 阅读(3) 评论(0) 推荐(0)
摘要:多线程算法(完整版)——算法导论第3版新增第27章Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest, Clifford Stein邓辉译原文:http://software.intel.com/sites/products/documentation/cilk/book_chapter.pdf本书中的主要算法都是顺序算法,适合于运行在每次只能执行一条指令的单处理器计算机上。在本章中,我们要把算法模型转向并行算法,它们可以运行在能够同时执行多条指令的多处理器计算机中。我们将着重探索优雅的动态多线程算法模型,该模型既有助于算法的设计和 阅读全文
posted @ 2012-03-09 23:54 vivianC 阅读(1586) 评论(0) 推荐(0)