摘要: 从Excel中读取数据(python-xlrd) 1、导入模块import xlrd 2、打开Excel文件读取数据data = xlrd.open_workbook('excelFile.xls') 3、使用技巧获取一个工作表 table = data.sheets()[0] #通过索引顺序获取t... 阅读全文
posted @ 2015-04-02 14:40 dayday+up 阅读(469) 评论(0) 推荐(0)
摘要: 准确率和召回率是数据挖掘中预测,互联网中得搜索引擎等经常涉及的两个概念和指标。准确率:又称“精度”,“正确率”召回率:又称“查全率”以检索为例,可以把搜索情况用下图表示:相关不相关检索到AB未检索到CDA:检索到的,相关的B:检索到的,但是不相关的C:未检索到的,但却是相关的D:未检索到的,也不相关... 阅读全文
posted @ 2015-04-01 17:58 dayday+up 阅读(597) 评论(0) 推荐(0)
摘要: 算法过程如下:1)从N个文档随机选取K个文档作为质心2)对剩余的每个文档测量其到每个质心的距离,并把它归到最近的质心的类3)重新计算已经得到的个各类的质心4)迭代2~3步直至新的质心与原质心相等或小于指定阈值,算法结束优点:1.算法快速,简单 2.对大数据集有较高的效率并且是可伸缩性的 ... 阅读全文
posted @ 2015-04-01 09:58 dayday+up 阅读(202) 评论(0) 推荐(0)
摘要: 线性相关计算 corrcoef(a,b) a,b-行向量 阅读全文
posted @ 2015-03-19 13:41 dayday+up 阅读(805) 评论(0) 推荐(0)
摘要: Python的Queue模块中提供了同步的、线程安全的队列类,包括FIFO(先入先出)队列Queue,LIFO(后入先出)队列LifoQueue,和优先级队列PriorityQueue。这些队列都实现了锁原语,能够在多线程中直接使用。可以使用队列来实现线程间的同步。Queue模块中的常用方法:Que... 阅读全文
posted @ 2015-03-18 17:01 dayday+up 阅读(13609) 评论(0) 推荐(0)
摘要: 如果多个线程共同对某个数据修改,则可能出现不可预料的结果,为了保证数据的正确性,需要对多个线程进行同步。使用Thread对象的Lock和Rlock可以实现简单的线程同步,这两个对象都有acquire方法和release方法,对于那些需要每次只允许一个线程操作的数据,可以将其操作放到acquire和r... 阅读全文
posted @ 2015-03-18 13:52 dayday+up 阅读(3326) 评论(0) 推荐(0)
摘要: #coding=utf-8#!/usr/bin/pythonimport threadimport time# 为线程定义一个函数def print_time( threadName, delay): count = 0 while count < 5: time.sleep(de... 阅读全文
posted @ 2015-03-18 10:40 dayday+up 阅读(216) 评论(0) 推荐(0)
摘要: word=['a','b','c','d','e','f','g']合并:e=word[:2]+word[1:]长度:l=len(word)增加元素:word.append("h")删除元素:del word[0] 阅读全文
posted @ 2015-03-10 18:30 dayday+up 阅读(124) 评论(0) 推荐(0)
摘要: 两个都是读取控制台输入的python内建函数。使用方法如下:#! /usr/bin/pythons1 = raw_input("Input your name:")print s1输入:123,abc等s2 = input("Input your name:")print s2输入:“abc”,"1... 阅读全文
posted @ 2015-03-10 17:57 dayday+up 阅读(175) 评论(0) 推荐(0)
摘要: 随机梯度上升法--一次仅用一个样本点来更新回归系数(因为可以在新样本到来时对分类器进行增量式更新,因而属于在线学习算法)梯度上升法在每次更新回归系统时都需要遍历整个数据集,该方法在处理100个左右的数据集时尚可,但如果有数十亿样本和成千上万的特征,那么该方法的计算复杂度太高了。随机梯度上升算法伪代码... 阅读全文
posted @ 2015-01-20 17:57 dayday+up 阅读(355) 评论(0) 推荐(0)
点击右上角即可分享
微信分享提示