会员
T恤
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
CodeMeals
Code Me and Give You a Code Meals.
博客园
首页
联系
订阅
管理
上一页
1
2
3
4
下一页
2014年5月18日
Java 集合与队列的插入、删除在并发下的性能比较
摘要: 测试并发情况下,java TreeSet和LinkedList的插入删除效率.
阅读全文
posted @ 2014-05-18 00:18 CodeMeals
阅读(3102)
评论(1)
推荐(0)
2014年5月16日
最大连续子序列和
摘要: 本文主要将最大连续子序列和的问题及其历史,这个题目在很多公司的面试中出现,编程之美也有讲述。
阅读全文
posted @ 2014-05-16 22:00 CodeMeals
阅读(5373)
评论(0)
推荐(0)
2014年5月13日
开发一个简单实用的android紧急求助软件
摘要: 实现了一个简单靠谱的求救求救APK,能在紧急情况下无需解锁即可发送求救短信给指定的人。
阅读全文
posted @ 2014-05-13 14:11 CodeMeals
阅读(1914)
评论(17)
推荐(4)
2014年4月23日
在茫茫人海中发现相似的你——局部敏感哈希(LSH)
摘要: 本文通过对对相似微博的发现,来讲述局部敏感hash的基本原理及应用
阅读全文
posted @ 2014-04-23 22:39 CodeMeals
阅读(16710)
评论(6)
推荐(12)
2014年1月6日
Hash中的一些概率计算
摘要: Hash是把锋利的刀子,处理海量数据时经常用到,大家可能经常用hash,但hash的有些特点你是否想过、理解过。我们可以利用我们掌握的概率和期望的知识,来分析Hash中一些有趣的问题,比如: 平均每个桶上的项的个数 平均查找次数 平均冲突次数 平均空桶个数 使每个桶都至少有一个项的项个数的期望
阅读全文
posted @ 2014-01-06 22:31 CodeMeals
阅读(9622)
评论(0)
推荐(3)
2013年11月19日
数据挖掘系列(7)分类算法评价
摘要: 本文介绍分类算法的评价
阅读全文
posted @ 2013-11-19 22:08 CodeMeals
阅读(7523)
评论(2)
推荐(4)
2013年11月4日
Android--保持加速度传感器在屏幕关闭后运行
摘要: 本文介绍android手机屏幕关闭后保持传感器运行的方法,对一些手机有效,对不支持该功能的手机无能无力。
阅读全文
posted @ 2013-11-04 19:11 CodeMeals
阅读(3797)
评论(0)
推荐(0)
2013年8月20日
数据挖掘系列(6)决策树分类算法
摘要: 从这篇开始,我将介绍分类问题,主要介绍决策树算法、朴素贝叶斯、支持向量机、BP神经网络、懒惰学习算法、随机森林与自适应增强算法、分类模型选择和结果评价。总共7篇,欢迎关注和交流。
阅读全文
posted @ 2013-08-20 12:43 CodeMeals
阅读(32589)
评论(6)
推荐(3)
2013年8月15日
数据挖掘系列(5)使用mahout做海量数据关联规则挖掘
摘要: 上一篇介绍了用开源数据挖掘软件weka做关联规则挖掘,weka方便实用,但不能处理大数据集,因为内存放不下,给它再多的时间也是无用,因此需要进行分布式计算,mahout是一个基于hadoop的分布式数据挖掘开源项目。
阅读全文
posted @ 2013-08-15 10:41 CodeMeals
阅读(5370)
评论(5)
推荐(2)
2013年8月14日
数据挖掘系列(4)使用weka做关联规则挖掘
摘要: 前面几篇介绍了关联规则的一些基本概念和两个基本算法,但实际在商业应用中,写算法反而比较少,理解数据,把握数据,利用工具才是重要的,前面的基础篇是对算法的理解,这篇将介绍开源利用数据挖掘工具weka进行管理规则挖掘。
阅读全文
posted @ 2013-08-14 15:49 CodeMeals
阅读(19916)
评论(15)
推荐(4)
2013年8月13日
数据挖掘系列(3)--关联规则评价
摘要: 本文介绍了9个关联规则评价的准则,其中全自信度、最大自信度、Kulc、cosine,Leverage是不受空值影响的,这在处理大数据集是优势更加明显,因为大数据中想MC这样的空记录更多,根据分析我们推荐使用kulc准则和不平衡因子结合的方法。
阅读全文
posted @ 2013-08-13 17:52 CodeMeals
阅读(13229)
评论(8)
推荐(7)
2013年8月6日
数据挖掘系列(2)--关联规则FpGrowth算法
摘要: FpGrowth算法通过构造一个树结构来压缩数据记录,使得挖掘频繁项集只需要扫描两次数据记录,而且该算法不需要生成候选集合,所以效率会比较高
阅读全文
posted @ 2013-08-06 10:39 CodeMeals
阅读(16078)
评论(22)
推荐(7)
2013年7月31日
数据挖掘系列(1)关联规则挖掘基本概念与Aprior算法
摘要: 本文主要介绍数据挖掘中频繁项集与关联规则挖掘的基本概念和Apriori经典算法的原理和实现。
阅读全文
posted @ 2013-07-31 16:18 CodeMeals
阅读(23964)
评论(14)
推荐(11)
2013年7月12日
谋事在人,成事在天,但求问心无愧--我的实习面试
摘要: 凡事尽力就好,但求问心无愧! 如果您有在深圳的数据挖掘实习生岗位,可以联系我:pengji256@126.com,不在乎工资,只希望能锻炼自己,感激不尽。
阅读全文
posted @ 2013-07-12 23:44 CodeMeals
阅读(2348)
评论(10)
推荐(2)
2013年7月3日
疯狂位图之——位图扩展随机数
摘要: 本篇主要讲述了扩展C语言的随机函数rand(),用位图实现了一个扩展算法,实现区间随机数的生成等。
阅读全文
posted @ 2013-07-03 09:43 CodeMeals
阅读(1318)
评论(0)
推荐(0)
2013年7月2日
疯狂位图之——位图生成12GB无重复随机乱序大整数集
摘要: 本文讲述利用位图生成一个无重复的乱序整数数据集。结合了位图和随机冲突处理。
阅读全文
posted @ 2013-07-02 09:41 CodeMeals
阅读(1939)
评论(6)
推荐(0)
2013年7月1日
疯狂位图之——位图实现12GB无重复大整数集排序
摘要: 位图排序的思想就是在内存中申请一块连续的空间作为位图,初始时将位图的每一位都置为0,然后依次读取待排序文件的整数,将整数所在的位设置为1,最后扫描位图,如果某一位为1,则说明这个数存在,输出到已排序文件。
阅读全文
posted @ 2013-07-01 10:05 CodeMeals
阅读(2535)
评论(9)
推荐(3)
2013年6月27日
海量数据处理利器之Hash——在线邮件地址过滤
摘要: 本文介绍了一个利用hash和位图实现在线邮件地址过滤的方案,并给出了最优情况下的数学形式。
阅读全文
posted @ 2013-06-27 10:54 CodeMeals
阅读(2764)
评论(13)
推荐(4)
2013年6月26日
python实现简易数据库之三——join多表连接和group by分组
摘要: 本文介绍用python实现一个简易数据库,主要讲述多表join连接和group by处理。
阅读全文
posted @ 2013-06-26 11:13 CodeMeals
阅读(5502)
评论(0)
推荐(2)
2013年6月22日
python实现简易数据库之二——单表查询和top N实现
摘要: 本文介绍用python实现一个简易数据库,包括基于正则的sql语句解析,和单表查询实现,与top n实现。
阅读全文
posted @ 2013-06-22 17:00 CodeMeals
阅读(3868)
评论(2)
推荐(2)
上一页
1
2
3
4
下一页
公告
Visitors