吴裕雄--天生自然python数据可视化--NetworkX精美网络图绘制
摘要:一、NetworkX 概述 NetworkX 是一个用 Python 语言开发的图论与复杂网络建模工具,内置了常用的图与复杂网络分析算法,可以方便的进行复杂网络数据分析、仿真建模等工作。 Networkx 支持创建简单无向图、有向图和多重图;内置许多标准的图论算法,节点可为任意数据;支持任意的边值维
阅读全文
吴裕雄--天生自然python机器学习:基于支持向量机SVM的手写数字识别
摘要:from numpy import * def img2vector(filename): returnVect = zeros((1,1024)) fr = open(filename) for i in range(32): lineStr = fr.readline() for j in range(32): ...
阅读全文
吴裕雄--天生自然python机器学习:支持向量机SVM
摘要:基于最大间隔分隔数据 寻找最大间隔 分类器求解的优化问题 这里的类别标签为什么采用-1和+1,而不是0和 1呢?这是由于-1和+1仅仅相差一个符号,方便数学上的处理。我们可以通过一个统一公式来表示间隔或者数据点到分隔超平面的距离,同 时不必担心数据到底是属于-1还是+1类。 S V M 应用的一般框
阅读全文
吴裕雄--天生自然python机器学习:使用Logistic回归从疝气病症预测病马的死亡率
摘要:,除了部分指标主观和难以测量外,该数据还存在一个问题,数据集中有 30%的值是缺失的。下面将首先介绍如何处理数据集中的数据缺失问题,然 后 再 利 用 Logistic回 归 和随机梯度上升算法来预测病马的生死。 准备数据:处理被据中的缺失值 因为有时候数据相当昂贵,扔掉和重新获取 都是不可取的,所
阅读全文
吴裕雄--天生自然python机器学习:Logistic回归
摘要:假设现在有一些数据点,我们用 一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称作回归。利用Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。这里的 “ 回归” 一词源于最佳拟合,表示要找到最佳拟合参数集。 训练分类器时的做法就是寻找最佳拟
阅读全文
吴裕雄--天生自然python机器学习:使用朴素贝叶斯过滤垃圾邮件
摘要:使用朴素贝叶斯解决一些现实生活中 的问题时,需要先从文本内容得到字符串列表,然后生成词向量。 准备数据:切分文本 测试算法:使用朴素贝叶斯进行交叉验证 文件解析及完整的垃圾邮件测试函数
阅读全文
吴裕雄--天生自然python机器学习:朴素贝叶斯算法
摘要:分类器有时会产生错误结果,这时可以要求分类器给出一个最优的类别猜测结果,同 时给出这个猜测的概率估计值。 概率论是许多机器学习算法的基础 在计算 特征值取某个值的概率时涉及了一些概率知识,在那里我们先统计特征在数据集中取某个特定值 的次数,然后除以数据集的实例总数,就得到了特征取该值的概率。 首先从
阅读全文
吴裕雄--天生自然python机器学习:使用决策树预测隐形眼镜类型
摘要:解决策树如何预测患者需要佩戴的隐形眼镜类型。使用小数据 集,我们就可以利用决策树学到很多知识:眼科医生是如何判断患者需要佩戴的镜片类型;一旦 理解了决策树的工作原理,我们甚至也可以帮助人们判断需要佩戴的镜片类型。 隐 形 眼 镜 数 据 集 是 非 常 著 名 的 数 据 集 ,它 包 含 很 多
阅读全文
吴裕雄--天生自然python机器学习:决策树算法
摘要:我们经常使用决策树处理分类问题’近来的调查表明决策树也是最经常使用的数据挖掘算法。 它之所以如此流行,一个很重要的原因就是使用者基本上不用了解机器学习算法,也不用深究它 是如何工作的。 K-近邻算法可以完成很多分类任务,但是它最大的缺点就是无法给出数据的内 在含义,决策树的主要优势就在于数据形式非常
阅读全文
吴裕雄--天生自然python机器学习:KNN-近邻算法在手写识别系统上的应用
摘要:准备数据:将图像转换为测试向量 每个数字大约有200个样本;目录中包含了大约900个测试 数据。我们使用目录比testDigits的数据训练分类器,使用目录把testDigits的数据测试分类器 的效果。两组数据没有覆盖,你可以检查一下这些文件夹的文件是否符合要求。 我们将把一个32*32的二进制图
阅读全文
吴裕雄--天生自然python机器学习:使用K-近邻算法改进约会网站的配对效果
摘要:准备数据:从文本文件中解析数据 海伦收集约会数据巳经有了一段时间,她把这些数据存放在文本文件(1如1^及抓 比加 中,每 个样本数据占据一行,总共有1000行。海伦的样本主要包含以下3种特征: 每年获得的飞行常客里程数 玩视频游戏所耗时间百分比 每周消费的冰淇淋公升数 将文本记录到转换NumPy的解
阅读全文
吴裕雄--天生自然python机器学习:K-近邻算法介绍
摘要:使用欧氏距离公式 例如,点(0,0)与(1, 2)之间的距离计算为: 如果数据集存在4个特征值,则点(1,0, 0,1)与(7, 6, 9,4)之间的距离计算为: 计算完所有点之间的距离后,可以对数据按照从小到大的次序排序。然后,确定前k个距离 最小元素所在的主要分类.使用这个分类器可以完成很多分类
阅读全文
吴裕雄--天生自然python机器学习:机器学习简介
摘要:除却一些无关紧要的情况,人们很难直接从原始数据本身获得所需信息。例如 ,对于垃圾邮 件的检测,侦测一个单词是否存在并没有太大的作用,然而当某几个特定单词同时出现时,再辅 以考察邮件长度及其他因素,人们就可以更准确地判定该邮件是否为垃圾邮件。简单地说,机器 学习就是把无序的数据转换成有用的信息。 机器学习横跨计算机科学、工程技术和统计学等多个学科,需要多学科的专业知识。稍后你 就能了解到,它也可以作
阅读全文
吴裕雄--天生自然python学习笔记:python 用pyInstaller模块打包文件
摘要:双击就可以运行那个hello.exe文件了,就算本机没有安装python也能运行这个文件。 双击就能运行这个文件了,就算本机不安装python也能正常运行。 以 onefile 方式打包 mp3player 声音播放程序 运行打包有额外的文件的时候,记得要把那些额外的文件复制到对应这个.exe文件目
阅读全文
吴裕雄--天生自然python学习笔记:python 用pygame模块开发俄罗斯方块游戏
摘要:俄罗斯方块游戏 多年前,游戏机中最流行的游戏就是“俄罗斯方块”了。时至今日,虽然网络 游戏日新月异 ,但“俄罗斯方块”这款小游戏仍在许多人心中 占有一席之地。本例中, 我们将亲手设计一个简单的俄罗斯方块游戏 。 应用程序总览 开始时游戒窗门的下方会显示“单击鼠标左键开始游戏”的提示信息,用户单 击左键后显示游戏画面 。 用户移动鼠标控制滑板,滑板只能左右移动,其位置与鼠 标的 x 坐标相同:共有...
阅读全文
吴裕雄--天生自然python学习笔记:python 用pygame模块动画一让图片动起来
摘要:动画是游戏开发中不可或缺的要素,游戏中的角色只有动起来才会拥有“生命”, 但动画处理也是最让游戏开发者头痛的部分。Pygame 包通过不断重新绘制绘图窗口,短短几行代码就可以让图片动起来! 动画处理程序的基本架构 import pygame pygame.init() screen = pygame.display.set_mode((640, 320)) pygame.display.set_c
阅读全文
吴裕雄--天生自然python学习笔记:python 用pygame模块基本绘图
摘要:绘制几何图形是游戏包的基本功能,很多游戏角色都是由基本图形组合而成的 。 绘制矩形: pygame.draw.rect Pygam巳绘制矩形的语法为: 用基本绘图绘制一个人脸 用基本绘图功能绘制人脸 import pygame pygame.init() screen = pygame.display.set_mode((300, 300)) pygame.display.set_caption(
阅读全文