随笔分类 - python
studying
摘要:read直接读入整个文件,存成一个字符串变量readline一行一行读入文件,所以说读取的文件可以大于内存,但是读取的速度很慢readlines一次读取整个文件,存成一个列表,所以说也必须小于内存。从使用上来说,除非是文件太大一般不用readline如文件如下:代码如下结果如下:来自为知笔记(Wiz...
阅读全文
摘要:Logistic回归的使用和缺失值的处理从疝气病预测病马的死亡率数据集:UCI上的数据,368个样本,28个特征测试方法:交叉测试实现细节:1.数据中因为存在缺失值所以要进行预处理,这点待会再单独谈2.数据中本来有三个标签,这里为了简单直接将未能存活和安乐死合并了3.代码中计算10次求均值缺失值的处...
阅读全文
摘要:Logistic回归算法优缺点:1.计算代价不高,易于理解和实现2.容易欠拟合,分类精度可能不高3.适用数据类型:数值型和标称型算法思想:其实就我的理解来说,logistic回归实际上就是加了个sigmoid函数的线性回归,这个sigmoid函数的好处就在于,将结果归到了0到1这个区间里面了,并且s...
阅读全文
摘要:贝叶斯的应用过滤垃圾邮件贝叶斯分类器的著名的应用就是垃圾邮件过滤了,这方面推荐想详细了解的可以去看看《黑客与画家》或是《数学之美》中对应的章节,贝叶斯的基础实现看这里数据集两个文件夹,分别是正常邮件和垃圾邮件,其中各有25封邮件测试方法从50封邮件中随机选取10封做为测试数据实现细节1.首先我们需要...
阅读全文
摘要:题目描述:Design a stack that supports push, pop, top, and retrieving the minimum element in constant time.push(x) -- Push element x onto stack.pop() -- Re...
阅读全文
摘要:朴素贝叶斯算法优缺点优点:在数据较少的情况下依然有效,可以处理多类别问题缺点:对输入数据的准备方式敏感适用数据类型:标称型数据算法思想:朴素贝叶斯比如我们想判断一个邮件是不是垃圾邮件,那么我们知道的是这个邮件中的词的分布,那么我们还要知道:垃圾邮件中某些词的出现是多少,就可以利用贝叶斯定理得到。朴素...
阅读全文
摘要:决策树算法优缺点:优点:计算复杂度不高,输出结果易于理解,对中间值缺失不敏感,可以处理不相关的特征数据缺点:可能会产生过度匹配的问题适用数据类型:数值型和标称型算法思想:1.决策树构造的整体思想:决策树说白了就好像是if-else结构一样,它的结果就是你要生成这个一个可以从根开始不断判断选择到叶子节...
阅读全文
摘要:kNN算法算法优缺点:优点:精度高、对异常值不敏感、无输入数据假定缺点:时间复杂度和空间复杂度都很高适用数据范围:数值型和标称型算法的思路:KNN算法(全称K最近邻算法),算法的思想很简单,简单的说就是物以类聚,也就是说我们从一堆已知的训练集中找出k个与目标最靠近的,然后看他们中最多的分类是哪个,就...
阅读全文
摘要:python调用Shell脚本,有两种方法:os.system(cmd)或os.popen(cmd),前者返回值是脚本的退出状态码,后者的返回值是脚本执行过程中的输出内容。所以说一般我们认为popen更加强大os.system(cmd):该方法在调用完shell脚本后,返回一个16位的二进制 数,低...
阅读全文
摘要:首先你需要安装上mysql和MySQLdb模块(当然还有其他模块可以用),这里我就略过了,如果遇到问题自行百度(或者评论在下面我可以帮忙看看)这里简单记录一下自己使用的学习过程:一、连接数据库 MySQLdb提供了connect函数,使用如下 cxn=MySQLdb.Connect(host='...
阅读全文
摘要:既然能够用python解析rss,那么也顺带研究下生成rss。其实很简单,只是生成一个比较特殊点的xml文档而已。这里我使用了PyRss2Gen,用法很简单,看代码就知道了,如下: 1 import datetime 2 import PyRSS2Gen 3 4 rss = PyRSS...
阅读全文
摘要:虽然说当今的博客已经不像前几年那么火了,但是RSS还是一项很有创造性和实用性的东西。RSS 是用于分发 Web 站点上的内容的摘要的一种简单的 XML 格式。它能够用于共享各种各样的信息。关于RSS的详细信息在(http://www.rssboard.org/rss-profile),这里面详细的讲...
阅读全文
摘要:最近需要从多个excel表里面用各种方式整理一些数据,虽然说原来用过java做这类事情,但是由于最近在学python,所以当然就决定用python尝试一下了。发现python果然简洁很多。这里简单记录一下。(由于是用到什么学什么,所以不算太深入,高手勿喷,欢迎指导)一、读excel表读excel要用...
阅读全文
摘要:最近学习python,想要找点练习,在看《python核心编程》(真是一本好书,非常详细,觉得看这一本书就够了,余下可以翻翻文档)。觉得cf之类的虽然能用python提交但是重点不是在学习python上 。终于找到了两个不错的网站checkio和pythonchallenge。今天先看看了看chec...
阅读全文

浙公网安备 33010602011771号