摘要: https://github.com/zhuyi10/hadoop_data_analysis跟大家交流一下我写的数据分析工具用hadoop streaming执行python写的mapper, reducer目前只实现了一些简单的分析功能希望大家多提意见 阅读全文
posted @ 2014-12-24 09:01 zy001 阅读(168) 评论(0) 推荐(0)
摘要: https://github.com/zhuyi10/statistics自己写了一个python 数据分析库,主要实现了一些基本统计方法,希望大家交流指正 阅读全文
posted @ 2014-12-14 07:49 zy001 阅读(185) 评论(1) 推荐(0)
摘要: 测了一下两分搜索 和 线性搜索的运行时间,用的都是由小到大排序好的数组,搜最大的数线性搜索数组大小运行时间(s)100000.011000000.0210000000.07100000000.5两分搜索数组大小运行时间(s)100000.011000000.01510000000.051000000... 阅读全文
posted @ 2014-10-01 11:49 zy001 阅读(237) 评论(0) 推荐(0)
摘要: 线性访问速度是随机访问的2倍左右一下是数组长度和两种访问的时间,单位是秒数组长度线性随机1000.010.0110000.010.01100000.0150.0151000000.020.0310000000.10.21000000012比较的时候把产生随机数的时间减掉了,长度是一亿的时候程序直接挂... 阅读全文
posted @ 2014-10-01 01:52 zy001 阅读(677) 评论(0) 推荐(0)
摘要: 做了些实验,感觉用链表实现队列比用数组实现队列性能好进出队的每秒操作数比较数组队列enqueue37,037dequeue4,166,666链表队列enqueue277,778dequeue666,667先入队n次,再出队n次的运行时间比较,单位是秒出入队次数|数组队列运行时间|链表队列运行时间1,... 阅读全文
posted @ 2014-09-26 11:59 zy001 阅读(758) 评论(0) 推荐(0)
摘要: 通过Fibonacci的迭代,生成器,循环三种实现,观察迭代,生成器,循环的效率。结论:迭代效率非常低,生成器和循环相近一下是代码和运行时间import sysdef fibo(n): if n 1: n -= 1 f = f0 + f1 f0 = f1 f1 = f return f... 阅读全文
posted @ 2014-09-20 03:27 zy001 阅读(210) 评论(0) 推荐(0)
摘要: 请教一个算法题,我的方法因为速度慢不通过这是题目:https://www.hackerrank.com/challenges/almost-sorted-intervalShik喜欢有序的区间。但目前他没有足够的时间对数字进行排序。于是他决定用几乎有序的区间。 一个几乎有序的区间是序列中满足如下性质... 阅读全文
posted @ 2014-09-19 01:56 zy001 阅读(166) 评论(0) 推荐(0)
摘要: 我比较了一下sort和一个自己写的o(n)的程序的运行时间。惊奇发现sort的速度几乎和直接用python写的o(n)的程序运行时间接近先上代码sort的测试代码import randomimport syslen_test_arr = int(sys.argv[1])test_arr = [ran... 阅读全文
posted @ 2014-09-18 08:38 zy001 阅读(679) 评论(0) 推荐(0)