随笔分类 - Python
摘要:1. 计算机编码历史 ASCII Python的默认编码,其是一种单字节的编码。刚开始计算机世界里只有英文,而单字节可以表示256个不同的字符。最开始ASCII只定义了128个字符编码,包括96个文字和32个控制符号,因此ASCII只使用了一个字节的后7位,最高位都为0。每个字符和ASCII码的对应
阅读全文
摘要: 最近突然对爬虫颇感兴趣,于是一直在学习[静觅的技术博客][1],这篇权当是篇学习笔记罢。 1. 准备 简单起见,我们只需要实现把最新的段子爬取,并且把图片过滤即可。也就是说,我们需要爬取的网站是http://www.qiushibaike.com/ho
阅读全文
摘要:`参考:《机器学习实战》 Machine Learning in Action` 一、 基本思想 PCA(Principal Component Analysis),主成分分析。是目前应用最为广泛的降维技术。 什么是降维?举个例子:假设我们正通过电视观看体育比赛,显示器大概包
阅读全文
摘要:`参考:《机器学习实战》 Machine Learning in Action` 一、 基本思想 聚类是一种无监督的学习,它将相似的对象归到同一簇中。它有点像全自动分类。聚类方法几乎可以应用于所有对象,簇内的对象越相似,聚类的效果越好。之所以称作 ,是因为它可以发现k个不同的簇,且每个簇
阅读全文
摘要:`参考:《机器学习实战》 Machine Learning in Action` 一、 基本思想 简单的说,用概率的高低来决定数据属于哪一类别,这就是贝叶斯决策理论的核心思想,即选择具有最高概率的决策。 ,则是在贝叶斯基础上做了一些最原始、最简单的假设。在朴素贝叶斯中,假设 ,比如假设a
阅读全文
摘要:`参考:《机器学习实战》 Machine Learning in Action` 一、 基本思想 我们所熟知的决策树的形状可能如下: ![image_1bp6chq921vrmlba1tej1c4mrk29.png 43kB][1] 使用决策树算法的目的就是生成类似于上图的分
阅读全文
摘要:`参考:《机器学习实战》 Machine Learning in Action` 一、 必备的包 实现此算法需要准备以下的包: • matplotlib,用于绘图 • numpy,数组处理库 我一般是用pip安装,若不熟悉这些库,可以搜索一下它们的简单教程。 二、 基本思想 假设存在一个
阅读全文
摘要:参考:《机器学习实战》- Machine Learning in Action 一、 必备的包 一般而言,这几个包是比较常见的: • matplotlib,用于绘图 • numpy,数组处理库 • pandas,强大的数据分析库 • sklearn,用于线性回归的库 • scipy, 提供很多有用的
阅读全文
摘要:1. 评估方法 通常,我们可通过实验测试来对学习器的泛化误差(在新样本上的误差)进行评估并进而做出选择,为此,需使用一个“测试集”来测试学习器对新样本的判断能力,然后以测试集上的“测试误差”作为泛化误差的近似。主要有以下几种测试方法: 1.1 留出法
阅读全文

浙公网安备 33010602011771号