会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
tychyg's Blog
开心玩数据,专注于大数据、BI
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
···
10
下一页
2016年3月23日
40个你可能不知道的Python的特点和技巧
摘要: 1、拆箱 2、使用拆箱进行变量交换 3、扩展的拆箱(Python 3支持) 4、负数索引 5、列表切片(a[start:end]) 6、负数索引的列表切片 7、带步数的列表切片(a[start:end:step]) 8、负数步数的列表切片 9、列表切片赋值 10、切片命名(slice(start,
阅读全文
posted @ 2016-03-23 20:39 开心玩数据
阅读(426)
评论(0)
推荐(0)
2016年3月14日
Python Streaming实战2: Join的实现与数据过滤
摘要: (三)Streaming快速编程 1. mapper.py 2. reduce.py (四)准备文件 1. 准备好本地文件 2. 将本地文件student.dat与course.dat 上传到云梯目录 (五)设置Streaming参数并执行 (六)最后的输出:为了便于查看,你
阅读全文
posted @ 2016-03-14 22:34 开心玩数据
阅读(1722)
评论(0)
推荐(0)
python + Streaming框架的MR实践与优化
摘要: Streaming是Hadoop提供的一个可以使用其他编程语言来进行MR编程的API,它使用Unix标准输入输出作为Hadoop和其他编程语言的开发接口,非常轻便。而开发者可以选择自己擅长的编程语言,并且只需要在MR程序中实现计算逻辑后,指定输出即可。 Python可以通过Streaming
阅读全文
posted @ 2016-03-14 22:33 开心玩数据
阅读(1670)
评论(0)
推荐(0)
python编码最佳实践之总结
摘要: 提到性能,最容易想到的是降低复杂度,一般可以通过测量代码回路复杂度(cyclomatic complexitly)和Landau符号(大O)来分析, 比如dict查找是O(1),而列表的查找却是O(n),显然数据的存储方式选择会直接影响算法的复杂度。 1. 在列表中查找: 对于已经排
阅读全文
posted @ 2016-03-14 22:22 开心玩数据
阅读(420)
评论(0)
推荐(0)
Python自然语言处理系列之模拟退火算法
摘要: 1、基本概念 模拟退火算法(Simulated Annealing,SA)是一种模拟固体降温过程的最优化算法。其模拟的过程是首先将固体加温至某一温度,固体内部的粒子随温度上升慢慢变为无序的状态,内能增大,然后让其慢慢冷却,温度下降时,内部的粒子慢慢趋于有序,达到一种平衡态,最后达到常温
阅读全文
posted @ 2016-03-14 21:42 开心玩数据
阅读(9440)
评论(0)
推荐(0)
支付宝红包口令图片识别SVM实现[附python代码]
该文被密码保护。
阅读全文
posted @ 2016-03-14 21:35 开心玩数据
阅读(0)
评论(0)
推荐(0)
Python自然语言处理 - 系列四
摘要: 一 如何使用形式化语法来描述无限的句子集合的结构? --上下位无关文法
阅读全文
posted @ 2016-03-14 21:30 开心玩数据
阅读(313)
评论(0)
推荐(0)
机器学习实践中的 7 种常见错误
摘要: 统计建模非常像工程学。 在工程学中,有多种构建键-值存储系统的方式,每个设计都会构造一组不同的关于使用模式的假设集合。在统计建模中,有很多分类器构建算法,每个算法构造一组不同的关于数据的假设集合。 当处理少量数据时,尝试尽可能多的算法,然后挑选最好的一个的做法是比较合理的,因为此时实验成本很低。但当
阅读全文
posted @ 2016-03-14 21:28 开心玩数据
阅读(309)
评论(0)
推荐(0)
玩转python主题模型程序库gensim
摘要: gensim是python下一个极易上手的主题模型程序库(topic model),网址在:http://radimrehurek.com/gensim/index.html 安装过程较为繁琐,参考http://radimrehurek.com/gensim/install.html 中的步骤
阅读全文
posted @ 2016-03-14 21:22 开心玩数据
阅读(1286)
评论(0)
推荐(0)
Python自然语言处理 - 系列三
摘要: ![enter image description here][1]例子:涉及一个特征器,给定一个姓名分析出是男性名字还是女性名字 分析:男性和女性的名字有一些鲜明的特点。以a,e 和i 结尾的很可能是女性,而以k,o,r,s 结尾的很可能是男性。让我们建立一个分类器更精确地模拟这些差异。 ![en
阅读全文
posted @ 2016-03-14 21:20 开心玩数据
阅读(332)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
···
10
下一页
公告