随笔分类 -  算法和数学

摘要:译者:July二零一一年一月十五日-----------------------------------------参考文献:国际权威的学术组织ICDM,于06年12月年评选出的数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaB... 阅读全文
posted @ 2015-11-22 21:43 二郎那个三郎
摘要:基于用户投票的排名算法(一):Delicious和Hacker News作者:阮一峰互联网的出现,意味着"信息大爆炸"。用户担心的,不再是信息太少,而是信息太多。如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题。各种各样的排名算法,是目前过滤信息的主要手段之一。对信息进行排名... 阅读全文
posted @ 2015-11-22 21:05 二郎那个三郎
摘要:作者:阮一峰日期:2012年9月24日有人在Stack Exchange问了一个问题: "我一直觉得虚数(imaginary number)很难懂。 中学老师说,虚数就是-1的平方根。 可是,什么数的平方等于-1呢?计算器直接显示出错! 直到今天,我也没有搞懂。谁能解释,虚数到底是什么?... 阅读全文
posted @ 2015-11-22 20:59 二郎那个三郎
摘要:泊松分布与美国枪击案作者:阮一峰日期:2013年1月 8日去年12月,美国康涅狄格州发生校园枪击案,造成28人死亡。资料显示,1982年至2012年,美国共发生62起(大规模)枪击案。其中,2012年发生了7起,是次数最多的一年。去年有这么多枪击案,这是巧合,还是表明美国治安恶化了?前几天,我看到一... 阅读全文
posted @ 2015-11-22 20:49 二郎那个三郎
摘要:TF-IDF与余弦相似性的应用(一):自动提取关键词作者:阮一峰日期:2013年3月15日这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?... 阅读全文
posted @ 2015-11-22 20:44 二郎那个三郎