摘要: 作为一种极其简单的编程语言,Python目前成为了最炙手可热的几种语言之一。它不仅简单易学,而且它还为用户提供了各种各样的模块,功能强大,无所不能。有利必有弊,学习Python同样有困扰,其中之一就是Python的各种模块的各种内置函数太为繁杂,不好记忆。俗话说的好“好记性不如烂笔头”,既然不好... 阅读全文
posted @ 2015-08-22 21:24 Poll的笔记 阅读(3461) 评论(0) 推荐(1) 编辑
摘要: Bit-map是一种很巧妙的数据存储结构。所谓的Bit-map就是用一个bit位来标记某个元素对应的Value,而Key即是该元素。由于采用了Bit为单位来存储数据,可以大大节省存储空间。Bit-map在实际中也有着广泛的应用,比如快速排序,元素去重以及空间缩减等等。本文通过Bit-map的几个应用实例对Bit-map以及其扩展结构Bloom Filter进行介绍。 阅读全文
posted @ 2015-08-17 09:48 Poll的笔记 阅读(2702) 评论(3) 推荐(3) 编辑
摘要: 谈完数据结构中的树(详情见参照之前博文《数据结构中各种树》),我们来谈一谈机器学习算法中的各种树形算法,包括ID3、C4.5、CART以及基于集成思想的树模型Random Forest和GBDT。本文对各类树形算法的基本思想进行了简单的介绍,重点谈一谈被称为是算法中的“战斗机”,机器学习中的“屠... 阅读全文
posted @ 2015-08-16 17:28 Poll的笔记 阅读(11441) 评论(1) 推荐(14) 编辑
摘要: 数据结构中有很多树的结构,其中包括二叉树、二叉搜索树、2-3树、红黑树等等。本文中对数据结构中常见的几种树的概念和用途进行了汇总,不求严格精准,但求简单易懂。 阅读全文
posted @ 2015-08-15 17:49 Poll的笔记 阅读(73717) 评论(23) 推荐(80) 编辑
摘要: 哈希表(Hash Table)是一种特殊的数据结构,它最大的特点就是可以快速实现查找、插入和删除。因为它独有的特点,Hash表经常被用来解决大数据问题,也因此被广大的程序员所青睐。本文介绍了哈希表的基本思想、哈希表的创建、解决冲突和查找的方法以及对哈希表性能的讨论,并附有C++实现源码,希望对初学者有所帮助。 阅读全文
posted @ 2015-08-12 09:36 Poll的笔记 阅读(5893) 评论(7) 推荐(12) 编辑
摘要: 和排序算法一样,查找算法也是一种最为基本的算法。高效地查找可以使我们对数据进行更加高效地操作,熟练掌握各种查找算法也是一项基本的算法技能。 阅读全文
posted @ 2015-08-09 20:27 Poll的笔记 阅读(110747) 评论(20) 推荐(95) 编辑
摘要: 排序算法是一种最为基础的算法,可以说无处不在,比如我们的搜索引擎中搜索排序。本文详细介绍了常见的八种排序算法,并附有C++源码实现。最后,针对各种排序算法的性能,进行了比较和分析。 阅读全文
posted @ 2015-08-09 13:50 Poll的笔记 阅读(8991) 评论(5) 推荐(27) 编辑
摘要: 本文介绍了Python的几个特殊的函数,包括列表方法的三驾马车filter、map和reduce函数。此外,本文还介绍了Python中装饰器和匿名函数的用法。 阅读全文
posted @ 2015-07-26 22:49 Poll的笔记 阅读(7067) 评论(0) 推荐(3) 编辑
摘要: SVN是Subversion的简称,是一个开放源代码的版本控制系统,相较于RCS、CVS,它采用了分支管理系统,它的设计目标就是取代CVS。本文介绍了SVN的工作机制,并对常见的SVN命令进行了汇总。 阅读全文
posted @ 2015-07-24 08:32 Poll的笔记 阅读(6371) 评论(0) 推荐(0) 编辑
摘要: 机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考。机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的分类。 阅读全文
posted @ 2015-07-22 07:36 Poll的笔记 阅读(34969) 评论(13) 推荐(17) 编辑
摘要: 总结Linux下Mysql的简单操作,万事熟能生巧,多学多用就能轻松驾驭Mysql语句。 阅读全文
posted @ 2015-07-21 09:58 Poll的笔记 阅读(2958) 评论(2) 推荐(4) 编辑
摘要: 生活中很多场合需要用到分类,比如新闻分类、病人分类等等。 本文介绍朴素贝叶斯分类器(Naive Bayes classifier),它是一种简单有效的常用分类算法。一、病人分类的例子 让我从一个例子开始讲起,你会看到贝叶斯分类器很好懂,一点都不难。 某个医院早上收了六个门诊病人,如下表。 ... 阅读全文
posted @ 2015-07-20 08:36 Poll的笔记 阅读(4001) 评论(2) 推荐(5) 编辑
摘要: 使用机器学习方法解决问题时,有较多模型可供选择。 一般的思路是先根据数据的特点,快速尝试某种模型,选定某种模型后, 再进行模型参数的选择(当然时间允许的话,可以对模型和参数进行双向选择) 因为不同的模型具有不同的特点, 所以有时也会将多个模型进行组合,以发挥"三个臭皮匠顶一个诸葛亮的作用", ... 阅读全文
posted @ 2015-07-16 20:58 Poll的笔记 阅读(4396) 评论(0) 推荐(3) 编辑
摘要: 推荐系统中最常用的算法叫做协同过滤(Collaborative Filtering),协同过滤属于社会计算的一种。协同过滤常常被用于分辨某位特定顾客可能感兴趣的东西,这些结论来自于对其他相似顾客对哪些产品感兴趣的分析。协同过滤以其出色的速度和健壮性,在全球互联网领域炙手可热。本文详细地剖析了协同过滤算法,并利用MATLAB进行了仿真,希望对初学者有帮助。 阅读全文
posted @ 2015-07-12 21:17 Poll的笔记 阅读(19709) 评论(13) 推荐(15) 编辑
摘要: 1 字符串匹配 字符串匹配是计算机的基本任务之一。 字符串匹配是什么?举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD"? 许多算法可以完成这个任务,Knuth-Morris-Pratt算法(简称KMP)是最常用的之一... 阅读全文
posted @ 2015-07-09 14:50 Poll的笔记 阅读(8952) 评论(7) 推荐(16) 编辑
摘要: 本文主要介绍了如何利用Python Django来进行简单的Web开发。本文通过两个简单的实例Hello World和current time来展示,如何在Django环境下进行简单web页面的编写。 阅读全文
posted @ 2015-06-29 09:47 Poll的笔记 阅读(21878) 评论(4) 推荐(10) 编辑
摘要: 在没有接触互联网这个行业的时候,我就一直很好奇网站是怎么构建的。现在虽然从事互联网相关的工作,但是也一直没有接触过Web开发之类的东西,但是兴趣终归还是要有的,而且是需要自己动手去实践的。Web开发的途径有好多种,比如传统的.Net,还有很火爆的Java。Python作为一种灵活好学的脚本语言,已经越来越受程序员的欢迎和热捧,甚至成为程序员的必备技能。Django是Python的Web开放框架,好多人说学习Python就是在学Django,从这也可以看出Django的强大。博主也是刚刚接触Django,纯属个人兴趣爱好,望与广大博友共同学习和讨论。 阅读全文
posted @ 2015-06-28 12:11 Poll的笔记 阅读(111121) 评论(5) 推荐(27) 编辑
摘要: 本文介绍了数据库查询语言SQL以及它的一些基本操作,其中包括选择操作、插入操作、删除操作、更新操作等。本文配有大量实例,通俗易懂,适合于SQL入门的同学阅读。 阅读全文
posted @ 2015-06-27 12:09 Poll的笔记 阅读(4928) 评论(0) 推荐(4) 编辑
摘要: 本文用几个实例讲述了在Python中如何进行MySQL的安装和使用,其中包括数据库的连接、表的创建、插入、查询以及更新等操作。最后还简单介绍了数据库的事务机制,并对Python中的MySQL模块的常用函数进行了汇总。 阅读全文
posted @ 2015-06-26 22:50 Poll的笔记 阅读(8194) 评论(0) 推荐(2) 编辑
摘要: 本文详细地介绍了Hadoop的基本内容和框架,包括Hadoop是什么,Hadoop能做什么以及Hadoop的两个核心模块——HDFS和MapReduce。本文比较适合初学Hadoop的同学阅读。 阅读全文
posted @ 2015-06-22 23:47 Poll的笔记 阅读(11364) 评论(3) 推荐(31) 编辑