随笔分类 - python
关于python生态的学习
摘要:对数值类数据建模—加权k近邻算法 根据相邻的数据预测出目标的取值情况 算法: 计算给定向量与所有其他数据的距离,并按照距离排序 选出前k位,求前k个数据的加权平均,权重根据距离求得 要点: 计算距离:使用欧几里得距离算法 计算权重算法: 反函数 减法函数 高斯函数 缩放:对于各个变量的取值范围相差较
阅读全文
摘要:决策树 适合用来处理带有分界点的数据 优点 1. 易于解释:能结合实际数据对受训模型进行合理的解释,便于理解 2. 可以同时接受分类数据和数值数据作为输入 3. 允许数据缺失 缺点 1. 过度拟合:专门针对训练数据创建出来的分支,可能更具有特殊性。解决办法:对决策树进行剪枝 2. 针对不同类型的数据
阅读全文
摘要:分类 分类方法: 1. 朴素贝叶斯分类法 2. 费舍尔分类法 1.0 1.0 0.75 0.708333333333 0.15625 0.05 good bad unknown bad 0.78013986589 0.356335962833 good bad good bad
阅读全文
摘要:优化问题 使用随机优化解决写作类问题:存在多种变量的影响,存在许多个可能的解,通过对题解打分,找到一个问题的最优解。 优化的主要思想: 1. 找到影响结果的因素,比如这里旅行的航班价格、花费时间、租车费用等 2. 将考虑到的主要因素根据权重组成,计算出总的成本 3. 利用一定的算法找到成本最小时候的
阅读全文
摘要:聚类 属于无监督学习 目的:找到数据集中的不同群组 分级聚类 主要思想是: 1. 在数据集中找出两个最相似的节点 2. 根据这两个节点生成一个新的聚类节点,这个节点的数据为两个子节点的数据的平均值, 3. 将两个子节点从数据集中去除,将新的聚类节点加入数据 4. 回到1,直至数据集中只剩一个节点 K
阅读全文
摘要:Test——很重要但是没有被重视起来的一个环节,至少是我自己,其实自己之前在做java web的时候就去尝试过怎么做REST接口的测试,一直没有找到一种合适方式,而且因为时间紧没有进一步深究,但是造成的后果每次做了修改之后都测试不充分,引起新的问题,所以这次对于python正好看看Django的单元
阅读全文
摘要:前面已经说过了Django中model的一些用法,包括orm,以及操作的api,接下来就是搭一些简单的界面学习view——Django中的view。主要介绍以下两个方面: url映射 请求处理 模板文件 url映射和请求处理共同构成了MVC中的C——controller,这里面涉及了url的写法(主
阅读全文
摘要:Django是符合MVC架构的,这里现学习M—Model,而且Django自带了一个管理model(数据库)的界面,所以一并学习。 Database 配置 编辑Django的配置文件settings.py进行配置 添加polls app,修改后如下 最后一行位新添加的,表示新增一个app,类poll
阅读全文
摘要:缘起 既然python都学了,学习python的时候感觉是相见恨晚,一种新的编程语言带给我一种新的思考问题的方式,为了巩固学过的东西并进一步学习python,就想学学Django,看看会不会带给我关于web新的东西。把自己学习过程记录在这里,发现每次写博客都是对学习过的东西的一次整理和提升。 新建一
阅读全文
摘要:最近有些事儿比较忙,python的学习就断断续续,这个练习来得比预期的晚,不过还好,不管做什么,我都希望能认真对待,认真做好每一件事。 引入 这个练习原书中称作“使用XML-RPC进行文件共享”,题目是从使用的技术介绍的,做完这个练习之后我觉得最终其实实现的是一个迅雷的雏形——一个P2P下载器。当然
阅读全文
摘要:进行简单的web应用之后,接下来就应该学习python连接数据库,这个练习就是在上个练习的基础上将信息保存到数据库,这个联系也没有什么特别的,有之前java web的经验的话,很好理解,主要还是一个MySQLdb的学习。代码如下(创建数据库就忽略了吧): 从数据库查询message以列表的形式显示m
阅读全文
摘要:使用python解析xml,主要使用sax的ContentHandler中的标签开始和标签结束的方法驱动,然后在开始(或者结束)事件中决定使用什么处理方法,使用dispatcher来决定并分发到指定方法内处理处理流程如下: 初始化的时候创建一个目录list 遇到page在当前目录下新建一个html文
阅读全文
摘要:python 将文本转化为html
阅读全文