随笔分类 -  Essay

摘要:fromhttp://www.cnblogs.com/linyawen/archive/2012/03/15/2398292.html我们知道Python的内置dictionary数据类型是无序的,通过key来获取对应的value。可是有时我们需要对dictionary中 的item进行排序输出,可能根据key,也可能根据value来排。到底有多少种方法可以实现对dictionary的内容进行排序输出呢?下面摘取了 一些精彩的解决办法。#最简单的方法,这个是按照key值排序:def sortedDictValues1(adict):items = adict.items()items.sort 阅读全文
posted @ 2013-05-08 22:14 billowkiller 阅读(395) 评论(0) 推荐(0)
摘要:fromhttp://www.cnblogs.com/longdouhzt/archive/2012/05/19/2508844.htmlPython内置了一些非常有趣但非常有用的函数,充分体现了Python的语言魅力!filter(function, sequence):对sequence中的item依次执行function(item),将执行结果为True的item组成一个List/String/Tuple(取决于sequence的类型)返回:>>> def f(x): return x % 2 != 0 and x % 3 != 0>>> filter 阅读全文
posted @ 2013-05-08 20:06 billowkiller 阅读(121) 评论(0) 推荐(0)
摘要:论文:英文版,中文版1. 导论1.1 定义先给个定义: MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于key/value pair的数据集合,输出中间的基于key/value pair的数据集合;然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。使用这个抽象模型,我们只要表述我们想要执行的简单运算即可,而不必关心并行计算、容错、数据分布、负载均衡等复杂的细节,这些问题都被封装在了一个库里面。设计这个抽象模型的灵感来自Lisp和许多其他函数式语言的Map和Reduce的原语。1.2 概述 阅读全文
posted @ 2013-04-15 16:28 billowkiller 阅读(996) 评论(0) 推荐(0)
摘要:论文:英文版,中文版1. 导论先给个定义:GFS是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,但可以提供容错功能。它可以给大量的用户提供总体性能较高的服务。Google File System. Designed for system-to-system interaction, and not for user-to-system interaction. The chunk servers replicate the data automatically.Assumptions in Google File System (GFS) 阅读全文
posted @ 2013-04-10 12:26 billowkiller 阅读(1451) 评论(0) 推荐(0)
摘要:论文:英文版, 中文版1. 导论BigTable is a compressed, high performance, and proprietary data storage system built on Google File System, Chubby Lock Service, SSTable (log-structured storage like LevelDB) and a few other Google technologies.(这句是wikipedia摘抄的定义)构成:SchedulerGFSChubby Lock serviceSawzallMapReduceSST 阅读全文
posted @ 2013-03-30 22:02 billowkiller 阅读(565) 评论(0) 推荐(0)
摘要:refine from硝烟中的Scrum和XP--我们如何实施Scrum产品的backlog时Scrum的核心,也是一切的起源,从根本上说,它就是一个需求或故事特性等组成的列表,按照重要性的级别进行排序。它里面包含的是客户想要的东西,并用客户的术语加一描述。backlog的另外一个名称是故事。包括以下字段:IDName:一个简短的描述Importance:100以内打分,分数越高越重要Initial estimate:最小单位为stroy point,即为人天。估值无需准确,但是要保证相对的正确性。How to demo:简短的测试规范,先做啥,然后做啥,最后做啥,得到什么结果。Notes:相 阅读全文
posted @ 2013-02-26 21:51 billowkiller 阅读(265) 评论(0) 推荐(0)
摘要:edited from 36氪在互联网领域,要找到新的创新点,还是需要借鉴美国发展的模式。虽然美国与中国有着各自不同的国情,美国成功的应用在中国不一定可以找到适合它们的土壤,但是从中国几个新兴的创业巨头来看,无一不是根植与美国,由于中国的网络壁垒或者美国应用的本土化不强而创造出在中国的机会。从发展上看来,都是有先有多家startup的成立,在各自独立发展用户,或从相同的客户群中寻找潜在的用户资源,或是在不同的用户群众寻找,但是有一个共同点都是在美国成功的应用中进行借鉴。从《结网》中可以看到,对一个新兴的应用来说最为关键的不止是借鉴先有的成功的应用,还需要找到这个应用idea的起源,因为这里面包 阅读全文
posted @ 2013-02-25 21:39 billowkiller 阅读(172) 评论(0) 推荐(0)
摘要:项目说明来源为高等计算机网络的大作业设计。我们组选择的是p2p的流媒体视频点播系统。核心内容的是chord算法。系统分析局域网内的任何结点既可以发送媒体压缩信息给其他结点,也可以从其他结点接收视频信息。此外流媒体信息是在网内从多源结点获取,而非单源模式。改变传统的需要中央服务器的查询支持,虽然本系统也需要一个中央服务器进行存储数据源以及节点加入的初始化,但是一旦节点加入了p2p网络,那么中央服务器的功能便会弱化很多,客户端peer可以利用其他peer节点已有的信息进行资源查询,而不用经过中央服务器。 在理论上,chord是一个纯p2p算法,但是在试验中我们发现,在广域网中实现一个完全对等的p2 阅读全文
posted @ 2013-01-02 17:24 billowkiller 阅读(1360) 评论(0) 推荐(0)
摘要:最近,特别是十一这段期间,忽然发现我的时间是相当的不够用,作业什么的有一大堆等着我去处理,而且是在将要结束十一,提交作业的时间。为此我还推掉了几个聚会,在学校里赶作业,没敢出去玩。深究原因,应该是有太多的任务被我压下来,平时乱晃着忙着自己的杂事,缺少时间利用的紧迫感。等到截止日期的时候在统统一块儿赶着做,这样作业质量不高,自己也不痛快。回想本科时候就是这样,和牛人的差距也就在这里。怀进鹏校长在实验室开会的时候说过一句话,论文不是三天写出来的,而是三个月写出来的,意思是不应该是三个月在准备而三天之内把所有的东西赶出来,应该是三个月一点一点的递近,慢慢的把论文一点一点的赶出来。之前我是不相信时间安 阅读全文
posted @ 2012-10-06 18:47 billowkiller 阅读(146) 评论(0) 推荐(0)
摘要:刚听完amazon中国的一个演讲,忽然感觉自己有些方面需要改进和提高,写在这里仅供勉励!关注于问题本身,不要被周围的其他东西所干扰,减轻自己的功利心;不要被主讲人的话语思维所引导,要有自己的想法思想在里头,批判性的观察物体本身;接触业务,中心是算法,模型; 分清主次;说话方式不要太过尖锐,用商量的语气,端正自己的态度;不要急躁,深层次挖掘问题,或者是答案;注意培养自己的思维方式。不懂问题及时汇总查看。 阅读全文
posted @ 2012-09-27 16:30 billowkiller 阅读(128) 评论(0) 推荐(0)

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 3.0 Unported License.