zy001

2014年12月24日

摘要： https://github.com/zhuyi10/hadoop_data_analysis跟大家交流一下我写的数据分析工具用hadoop streaming执行python写的mapper, reducer目前只实现了一些简单的分析功能希望大家多提意见阅读全文

posted @ 2014-12-24 09:01 zy001 阅读(168) 评论(0) 推荐(0)

2014年12月14日

自制 python 数据分析库

摘要： https://github.com/zhuyi10/statistics自己写了一个python 数据分析库，主要实现了一些基本统计方法，希望大家交流指正阅读全文

posted @ 2014-12-14 07:49 zy001 阅读(186) 评论(1) 推荐(0)

2014年10月1日

其实两分搜索和线性搜索差距没那么大

摘要：测了一下两分搜索和线性搜索的运行时间，用的都是由小到大排序好的数组，搜最大的数线性搜索数组大小运行时间(s)100000.011000000.0210000000.07100000000.5两分搜索数组大小运行时间(s)100000.011000000.01510000000.051000000... 阅读全文

posted @ 2014-10-01 11:49 zy001 阅读(237) 评论(0) 推荐(0)

python list 线性访问和随机访问比较

摘要：线性访问速度是随机访问的2倍左右一下是数组长度和两种访问的时间，单位是秒数组长度线性随机1000.010.0110000.010.01100000.0150.0151000000.020.0310000000.10.21000000012比较的时候把产生随机数的时间减掉了，长度是一亿的时候程序直接挂... 阅读全文

posted @ 2014-10-01 01:52 zy001 阅读(681) 评论(0) 推荐(0)

2014年9月26日

数组队列与链表队列

摘要：做了些实验，感觉用链表实现队列比用数组实现队列性能好进出队的每秒操作数比较数组队列enqueue37,037dequeue4,166,666链表队列enqueue277,778dequeue666,667先入队n次，再出队n次的运行时间比较，单位是秒出入队次数|数组队列运行时间|链表队列运行时间1,... 阅读全文

posted @ 2014-09-26 11:59 zy001 阅读(767) 评论(0) 推荐(0)

2014年9月20日

从Fibonacci数组看迭代，生成器和循环的效率

摘要：通过Fibonacci的迭代，生成器，循环三种实现，观察迭代，生成器，循环的效率。结论：迭代效率非常低，生成器和循环相近一下是代码和运行时间import sysdef fibo(n): if n 1: n -= 1 f = f0 + f1 f0 = f1 f1 = f return f... 阅读全文

posted @ 2014-09-20 03:27 zy001 阅读(217) 评论(0) 推荐(0)

2014年9月19日

Almost sorted interval

摘要：请教一个算法题，我的方法因为速度慢不通过这是题目：https://www.hackerrank.com/challenges/almost-sorted-intervalShik喜欢有序的区间。但目前他没有足够的时间对数字进行排序。于是他决定用几乎有序的区间。一个几乎有序的区间是序列中满足如下性质... 阅读全文

posted @ 2014-09-19 01:56 zy001 阅读(174) 评论(0) 推荐(0)

2014年9月18日

python的内置排序究竟有多快

摘要：我比较了一下sort和一个自己写的o(n)的程序的运行时间。惊奇发现sort的速度几乎和直接用python写的o(n)的程序运行时间接近先上代码sort的测试代码import randomimport syslen_test_arr = int(sys.argv[1])test_arr = [ran... 阅读全文

posted @ 2014-09-18 08:38 zy001 阅读(686) 评论(0) 推荐(0)

公告