摘要: 爬虫学习一系列:urllib2抓取网页内容所谓网页抓取,就是把URL地址中指定的网络资源从网络中读取出来,保存到本地。我们平时在浏览器中通过网址浏览网页,只不过我们看到的是解析过的页面效果,而通过程序获取的则是程序源代码。我们通过使用Python中urllib2来获取网页的URL资源,最简单方法就是... 阅读全文
posted @ 2015-06-16 23:27 天才白痴梦 阅读(6427) 评论(3) 推荐(0) 编辑
摘要: 基于概率的分类方法:朴素贝叶斯贝叶斯决策理论朴素贝叶斯是贝叶斯决策理论的一部分,所以在讲解朴素贝叶斯之前我们先快速简单了解一下贝叶斯决策理论知识。贝叶斯决策理论的核心思想:选择具有最高概率的决策。比如我们毕业选择就业方向,选择C++方向的概率为0.3,选择Java的概率为0.2,选择机器学习的概率为... 阅读全文
posted @ 2015-06-16 14:55 天才白痴梦 阅读(2509) 评论(0) 推荐(1) 编辑