会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
dayday+up
博客园
首页
新随笔
联系
订阅
管理
随笔 - 37
文章 - 0
评论 - 3
阅读 -
82851
上一页
1
2
3
4
下一页
2015年4月2日
从Excel中读取数据(python-xlrd)
摘要: 从Excel中读取数据(python-xlrd) 1、导入模块import xlrd 2、打开Excel文件读取数据data = xlrd.open_workbook('excelFile.xls') 3、使用技巧获取一个工作表 table = data.sheets()[0] #通过索引顺序获取t...
阅读全文
posted @ 2015-04-02 14:40 dayday+up
阅读(469)
评论(0)
推荐(0)
2015年4月1日
准确率(Precision),召回率(Recall)以及综合评价指标(F1-Measure)
摘要: 准确率和召回率是数据挖掘中预测,互联网中得搜索引擎等经常涉及的两个概念和指标。准确率:又称“精度”,“正确率”召回率:又称“查全率”以检索为例,可以把搜索情况用下图表示:相关不相关检索到AB未检索到CDA:检索到的,相关的B:检索到的,但是不相关的C:未检索到的,但却是相关的D:未检索到的,也不相关...
阅读全文
posted @ 2015-04-01 17:58 dayday+up
阅读(597)
评论(0)
推荐(0)
K-means算法-聚类
摘要: 算法过程如下:1)从N个文档随机选取K个文档作为质心2)对剩余的每个文档测量其到每个质心的距离,并把它归到最近的质心的类3)重新计算已经得到的个各类的质心4)迭代2~3步直至新的质心与原质心相等或小于指定阈值,算法结束优点:1.算法快速,简单 2.对大数据集有较高的效率并且是可伸缩性的 ...
阅读全文
posted @ 2015-04-01 09:58 dayday+up
阅读(202)
评论(0)
推荐(0)
2015年3月19日
用线性回归寻找到最佳拟合直线
摘要: 线性相关计算 corrcoef(a,b) a,b-行向量
阅读全文
posted @ 2015-03-19 13:41 dayday+up
阅读(805)
评论(0)
推荐(0)
2015年3月18日
python多线程--优先级队列(Queue)
摘要: Python的Queue模块中提供了同步的、线程安全的队列类,包括FIFO(先入先出)队列Queue,LIFO(后入先出)队列LifoQueue,和优先级队列PriorityQueue。这些队列都实现了锁原语,能够在多线程中直接使用。可以使用队列来实现线程间的同步。Queue模块中的常用方法:Que...
阅读全文
posted @ 2015-03-18 17:01 dayday+up
阅读(13609)
评论(0)
推荐(0)
python多线程--线程同步
摘要: 如果多个线程共同对某个数据修改,则可能出现不可预料的结果,为了保证数据的正确性,需要对多个线程进行同步。使用Thread对象的Lock和Rlock可以实现简单的线程同步,这两个对象都有acquire方法和release方法,对于那些需要每次只允许一个线程操作的数据,可以将其操作放到acquire和r...
阅读全文
posted @ 2015-03-18 13:52 dayday+up
阅读(3326)
评论(0)
推荐(0)
python多线程
摘要: #coding=utf-8#!/usr/bin/pythonimport threadimport time# 为线程定义一个函数def print_time( threadName, delay): count = 0 while count < 5: time.sleep(de...
阅读全文
posted @ 2015-03-18 10:40 dayday+up
阅读(216)
评论(0)
推荐(0)
2015年3月10日
元组操作
摘要: word=['a','b','c','d','e','f','g']合并:e=word[:2]+word[1:]长度:l=len(word)增加元素:word.append("h")删除元素:del word[0]
阅读全文
posted @ 2015-03-10 18:30 dayday+up
阅读(124)
评论(0)
推荐(0)
input()和raw_input()
摘要: 两个都是读取控制台输入的python内建函数。使用方法如下:#! /usr/bin/pythons1 = raw_input("Input your name:")print s1输入:123,abc等s2 = input("Input your name:")print s2输入:“abc”,"1...
阅读全文
posted @ 2015-03-10 17:57 dayday+up
阅读(175)
评论(0)
推荐(0)
2015年1月20日
机器学习基础-Logistic回归2
摘要: 随机梯度上升法--一次仅用一个样本点来更新回归系数(因为可以在新样本到来时对分类器进行增量式更新,因而属于在线学习算法)梯度上升法在每次更新回归系统时都需要遍历整个数据集,该方法在处理100个左右的数据集时尚可,但如果有数十亿样本和成千上万的特征,那么该方法的计算复杂度太高了。随机梯度上升算法伪代码...
阅读全文
posted @ 2015-01-20 17:57 dayday+up
阅读(355)
评论(0)
推荐(0)
上一页
1
2
3
4
下一页
公告
昵称:
dayday+up
园龄:
10年6个月
粉丝:
2
关注:
1
+加关注
<
2025年7月
>
日
一
二
三
四
五
六
29
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
6
7
8
9
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
积分与排名
积分 - 37607
排名 - 45388
随笔分类
C/C++(1)
Java(1)
Python语言(16)
R语言(1)
安装工具(6)
机器学习(15)
书单(1)
数据挖掘(8)
修士论文相关(4)
随笔档案
2016年3月(3)
2015年12月(1)
2015年11月(2)
2015年9月(2)
2015年8月(1)
2015年7月(4)
2015年6月(2)
2015年5月(1)
2015年4月(7)
2015年3月(6)
2015年1月(3)
2014年12月(5)
阅读排行榜
1. 皮尔逊相关系数的计算(python代码版)(25626)
2. Z-Score数据标准化处理(python代码)(15029)
3. python多线程--优先级队列(Queue)(13609)
4. python多线程--线程同步(3326)
5. 多元线性回归(pandas/scikit-learn)(2406)
评论排行榜
1. Mahout0.9安装与配置(完全分布式模式下运行)(2)
2. 皮尔逊相关系数的计算(python代码版)(1)
推荐排行榜
1. Z-Score数据标准化处理(python代码)(2)
2. Mahout0.9安装与配置(完全分布式模式下运行)(1)
最新评论
1. Re:皮尔逊相关系数的计算(python代码版)
默默说一声最后少了个括弧
--XerCis
2. Re:Mahout0.9安装与配置(完全分布式模式下运行)
@ scriptin我安装的hadoop2.7,这里确实是我设置错了,因为并没有影响正常使用,所以没有注意。感谢指正~...
--dayday+up
3. Re:Mahout0.9安装与配置(完全分布式模式下运行)
楼主装的hadoop 2.7么?2.7中没有conf文件夹了,而是用$HADOOP_HOME/etc/hadoop代替了。所以第五步:5.编辑$MAHOUT_HOME/bin/mahout,将HADO...
--scriptin
点击右上角即可分享