上一页 1 2 3 4 5 6 7 8 9 ··· 43 下一页
摘要: 从hadoop框架与MapReduce模式中谈海量数据处理前言 几周前,当我最初听到,以致后来初次接触Hadoop与MapReduce这两个东西,我便稍显兴奋,觉得它们很是神秘,而神秘的东西常能勾起我的兴趣,在看过介绍它们的文章或论文之后,觉得Hadoop是一项富有趣味和挑战性的技术,且它还牵扯到了一个我更加感兴趣的话题:海量数据处理。 由此,最近凡是空闲时,便在看“Hadoop”,“MapReduce”“海量数据处理”这方面的论文。但在看论文的过程中,总觉得那些论文都是浅尝辄止,常常看的很不过瘾,总是一个东西刚要讲到紧要处,它便结束了,让我好生“愤懑”。 尽管我对这个Hadoop与MapRe 阅读全文
posted @ 2011-08-20 13:08 我的IT世界 阅读(184) 评论(0) 推荐(0)
摘要: 重启开源,分享无限--诚邀你加入微软面试187题的解题中前期回顾 我想,只要是稍微浏览过我博客的朋友都知道,本博客内总体上大致分为两个部分的内容:1、算法(如十六个经典算法研究系列);2、面试与编程(涉及到微软面试100题系列,程序员编程艺术系列,海量数据处理面试题集锦等等)。从开博至今,大概10个多月之久,本博客内至始至终都是围绕着这两条主线“算法”和“面试”而创作各类文章,也正因为这两方面的内容,我才因此有幸认识全国各地的普天下的朋友。 从去年的10月初开始整理微软,google等各大公司的面试题起,陆陆续续的整理了187道面试题目(微软面试100题+微软面试100题第二版70题+海量数据 阅读全文
posted @ 2011-08-18 13:46 我的IT世界 阅读(178) 评论(0) 推荐(0)
摘要: 在过去的十年中,Oracle已经成为世界上最专业的数据库之一。对于IT专家来说,就是要确保利用Oracle的强大特性来提高他们公司的生产力。最有效的方法之一是通过Oracle调优。它有大量的调整参数和技术来改进你的Oracle数据库的性能。 Oracle调优是一个复杂的主题。关于调优可以写整整一本书,不过,为了改善Oracle数据库的性能,有一些基本的概念是每个Oracle DBA都应该遵从的。 在这篇简介中,我们将简要地介绍以下的Oracle主题: --外部调整:我们应该记住Oracle并不是单独运行的。因此我们将查看一下通过调整Oracle服务器以得到高的性能。 --Row re... 阅读全文
posted @ 2011-08-17 20:52 我的IT世界 阅读(267) 评论(0) 推荐(0)
摘要: 程序员编程艺术第十一章:最长公共子序列(LCS)问题0、前言 程序员编程艺术系列重新开始创作了(前十章,请参考程序员编程艺术第一~十章集锦与总结)。回顾之前的前十章,有些代码是值得商榷的,因当时的代码只顾阐述算法的原理或思想,所以,很多的与代码规范相关的问题都未能做到完美。日后,会着力修善之。 搜遍网上,讲解这个LCS问题的文章不计其数,但大多给读者一种并不友好的感觉,稍感晦涩,且代码也不够清晰。本文力图避免此些情况。力保通俗,阐述详尽。同时,经典算法研究系列的第三章(三、dynamic programming)写的极其糟糕,所以,也算是对那文的一种弥补。有任何问题,欢迎不吝赐教。第一节、问. 阅读全文
posted @ 2011-08-17 16:47 我的IT世界 阅读(216) 评论(0) 推荐(0)
摘要: 1、在访谈开始前,希望可以就之前OCM的经历和我们做一些回顾,因为您是我目前解除到的最年轻的OCM。另一方面,相信您也给公司的Oracle技术管理这个层面带来了很多有价值的东西,在开始之前您可以聊一下贵公司这边Oracle大致的使用情况。我现在所在单位里有很多和我一样技术水平的同事,只是机缘巧合我比较幸运,得到了这个机会,到Oracle原厂去学习并参加OCM考试,所以我获得OCM其实是一个水到渠成的事情,我们还有很多同事早已经具备了OCM大师的能力和水平,但是没有机会去获取认证。我现在所在的是浙江电信下属的一家软件公司,我们所提供的是针对浙江电信的Oracle产品实施和技术支持服务工作。所以我 阅读全文
posted @ 2011-08-16 13:56 我的IT世界 阅读(157) 评论(0) 推荐(0)
摘要: 从几幅架构图中偷得半点海量数据处理经验 (注:本文只是简简单单的截几幅图而已,要想更深入的学习和了解hadoop框架和mapreduce模式,或者对淘宝的数据魔方感兴趣的话,尽可参考此文:从Hadhoop框架与MapReduce模式中谈海量数据处理。) 最近对海量数据处理发生了不小的兴趣,特此从一些精彩文章中摘取几幅精彩的图片或片段,拿来给大家分享。所谓奇文共欣赏,好Architecture共品之。至于各位能从图中是窥得半点经验,还是一图以窥全貌,则不在我之责任,全在于读者怎么去解读这几幅精彩的架构图了。 所以,本文在选取一些架构图之后,只配以最简单的文字,个中内容,读者自行品味之。如果有任何 阅读全文
posted @ 2011-08-15 19:43 我的IT世界 阅读(246) 评论(0) 推荐(0)
摘要: 十七道海量数据处理面试题与Bit-map详解作者:小桥流水,redfox66,July。文章性质:整理。前言 本博客内曾经整理过有关海量数据处理的10道面试题(十道海量数据处理面试题与十个方法大总结),此次除了重复了之前的10道面试题之后,重新多整理了7道。仅作各位参考,不作它用。 同时,程序员编程艺术系列将重新开始创作,第十一章以后的部分题目来源将取自下文中的17道海量数据处理的面试题。因为,我们觉得,下文的每一道面试题都值得重新思考,重新深究与学习。再者,编程艺术系列的前十章也是这么来的。若您有任何问题或建议,欢迎不吝指正。谢谢。第一部分、十五道海量数据处理面试题1. 给定a、b两个文件, 阅读全文
posted @ 2011-08-14 14:07 我的IT世界 阅读(197) 评论(0) 推荐(0)
摘要: 海量数据处理之Bloom Filter详解 前言 本博客内曾已经整理过十道海量数据处理面试题与十个方法大总结。接下来,本博客内会重点分析那些海量数据处理的方法,并重写十道海量数据处理的面试题。如果有任何问题,欢迎不吝指正。谢谢。一、什么是Bloom Filter Bloom Filter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。Bloom Filter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(false positive)。因此,Bloom Filter不适合那些“零 阅读全文
posted @ 2011-08-14 13:19 我的IT世界 阅读(229) 评论(0) 推荐(0)
摘要: 十五、多项式乘法与快速傅里叶变换 前言 经典算法研究系列,已经写到第十五章了,本章,咱们来介绍多项式的乘法以及快速傅里叶变换算法。本博客之前也已详细介绍过离散傅里叶变换(请参考:十、从头到尾彻底理解傅里叶变换算法、上,及十、从头到尾彻底理解傅里叶变换算法、下),这次咱们从多项式乘法开始,然后介绍FFT算法的原理与实现。同时,本文虽涉及到不少数学公式和定理(当然,我会尽量舍去一些与本文咱们要介绍的中心内容无关的定理或证明,只为保证能让读者易于接受或理解),但尽量保证通俗易懂,以让读者能看个明白。 有朋友建议,算法专一种,就ok,没必要各个都学习。但个人实在抑制不住自己的兴趣,就是想写,当没法做到 阅读全文
posted @ 2011-08-13 18:37 我的IT世界 阅读(284) 评论(0) 推荐(0)
摘要: 以博会天下朋友 我每每感叹,幸甚至哉。为能拥有一群全国各地的朋友为傲。刚开始写博客时,从来没想过会认识这么多的朋友,包括后来建立技术交流群也只是纯粹为了交流的目的。而如今,非常非常之幸运和荣幸,能认识如此多的朋友。幸甚幸甚。 我一般每到一个城市,都会联系那里的此前从未谋面的朋友,而出来见个面,便是认识了。从此以后,也就成了朋友。我想,古往今来,以此种方式交朋友的人大概也很少吧。 或许,大部分人是因为我个人有某一方面的兴趣或技术才愿意来认识我的。然他们自然会发现,我的水平其实一般,只是在某一个时期内对某一个东西产生了不可想象的兴趣之后便深入学习和研究了它,而我个人本身对那个东西从未抱有任何什么目 阅读全文
posted @ 2011-08-12 20:20 我的IT世界 阅读(149) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 9 ··· 43 下一页