一线码农 - 博客园

2013年3月28日

摘要：我们知道矩阵是一个非常强大的数据结构，在动态规划以及各种图论算法上都有广泛的应用，当然矩阵有着不足的地方就是空间和时间复杂度都维持在N2上，比如1w个数字建立一个矩阵，在内存中会占用1w*1w=1亿的类型空间，这时就会遇到outofmemory。。。那么面临的一个问题就是如何来压缩矩阵，当然压缩的方式有很多种，这里就介绍一个顺序表的压缩方式：三元组。一：三元组有时候我们的矩阵中只有零星的一些非零元素，其余的都是零元素，那么我们称之为稀疏矩阵，当然没有绝对的说有多少个零元素才算稀疏。针对上面的这个无规律的存放非零元素，三元组提出了一种方法，就是仅仅记录矩阵中的非零元素以及它的行，列以及... 阅读全文

posted @ 2013-03-28 19:02 一线码农阅读(4923) 评论(3) 推荐(1)

2013年3月20日

经典算法题每日演练——第十九题双端队列

摘要：话说大学的时候老师说妹子比工作重要~，工作可以再换，妹子这个。。。所以。。。这两个月也就一直忙着Fall in love，嗨，慢慢调整心态吧，这篇就选一个简单的数据结构聊一聊，话说有很多数据结构都在玩组合拳，比如说：块状链表，块状数组，当然还有本篇的双端队列，是的，它就是栈和队列的组合体。一：概念我们知道普通队列是限制级的一端进，另一端出的FIFO形式，栈是一端进出的LIFO形式，而双端队列就没有这样的限制级，也就是我们可以在队列两端进行插入或者删除操作。二：编码1：定义结构体通常情况下，队列的内部都是采用数组来实现，而且带有两个指针head和tail来指向数组的区间段，为了充分利用数组空间. 阅读全文

posted @ 2013-03-20 18:09 一线码农阅读(6558) 评论(10) 推荐(4)

2013年1月18日

12篇学通C#网络编程——第四篇 TCP应用编程

摘要：年底了，人浮躁多了，沉不下去心研究技术了，不过昨天终于抢到了回家的票，很开心。言归正卷，在WCF出来之后，可能我们玩这些原始的TCP越来越少了，我们知道WCF对TCP进行了再一次的包装，第一反应给我们的或许是同构系统用TCP，异构系统用HTTP，那么问题来了，异构系统到底可不可以用TCP呢？至少WCF是玩不了的，因为其他语言没有针对.net的“服务引用”，也没有什么ChannelFactory给你去玩，如果你是一定要追求性能的话，原始的TCP会助你一臂之力的。我们知道最最原始的是玩Socket，由于Socket比较复杂，但是最灵活，C#里面提供了两个简化的包装类：TcpListener和T. 阅读全文

posted @ 2013-01-18 15:30 一线码农阅读(11359) 评论(7) 推荐(12)

2013年1月4日

玩玩图形图像——第一篇：图片灰度化

摘要：去年买了本数字图像处理算法，一直都没有看，前几个星期都一直忙着工作上的活，趁这阶段悠闲点，玩一玩图片处理，这玩意还是非常有意思的。以前我们在做Web上的用户注册时，通常都会做一个验证码，大家都知道用来防止暴力注册的，当然提到验证码大家都知道C#里面有一个Bitmap类专门用来处理图片的，好吧，这一篇我们从最简单的“图片灰度化”说起。一：图片灰度化我们都知道，位图是由一个一个像素点组成的，像素点可能是红色，橙色，粉色等等，这些颜色我们都知道是用RGB来表示的。每个颜色分量都是一个字节(0-255)，所以一般情况下图的像素点都是24位，当然还有32位，64位，当RGB是0-255之间的不... 阅读全文

posted @ 2013-01-04 23:52 一线码农阅读(7353) 评论(17) 推荐(2)

2012年12月19日

经典算法题每日演练——第十八题外排序

摘要：说到排序，大家第一反应基本上是内排序，是的，算法嘛，玩的就是内存，然而内存是有限制的，总有装不下的那一天，此时就可以来玩玩外排序，当然在我看来，外排序考验的是一个程序员的架构能力，而不仅仅局限于排序这个层次。一：N路归并排序1.概序我们知道算法中有一种叫做分治思想，一个大问题我们可以采取分而治之，各个突破，当子问题解决了，大问题也就KO了，还有一点我们知道内排序的归并排序是采用二路归并的，因为分治后有LogN层，每层两路归并需要N的时候，最后复杂度为NlogN，那么外排序我们可以将这个“二”扩大到M，也就是将一个大文件分成M个小文件，每个小文件是有序的，然后对应在内存中我们开M个优先队... 阅读全文

posted @ 2012-12-19 14:44 一线码农阅读(13383) 评论(16) 推荐(15)

2012年12月18日

经典算法题每日演练——第十七题 Dijkstra算法

摘要：或许在生活中，经常会碰到针对某一个问题，在众多的限制条件下，如何去寻找一个最优解？可能大家想到了很多诸如“线性规划”，“动态规划”这些经典策略，当然有的问题我们可以用贪心来寻求整体最优解，在图论中一个典型的贪心法求最优解的例子就莫过于“最短路径”的问题。一：概序从下图中我要寻找V0到V3的最短路径，你会发现通往他们的两点路径有很多：V0->V4->V3，V0->V1->V3，当然你会认为前者是你要找的最短路径，那如果说图的顶点非常多，你还会这么轻易的找到吗？下面我们就要将刚才我们那点贪心的思维系统的整理下。二：构建如果大家已经了解Prim算法，那么Dijkstra算阅读全文

posted @ 2012-12-18 12:14 一线码农阅读(10634) 评论(0) 推荐(4)

2012年12月17日

经典算法题每日演练——第十六题 Kruskal算法

摘要：这篇我们看看第二种生成树的Kruskal算法，这个算法的魅力在于我们可以打一下算法和数据结构的组合拳，很有意思的。一：思想若存在M={0,1,2,3,4,5}这样6个节点，我们知道Prim算法构建生成树是从”顶点”这个角度来思考的，然后采用“贪心思想”来一步步扩大化，最后形成整体最优解，而Kruskal算法有点意思，它是站在”边“这个角度在思考的，首先我有两个集合。1. 顶点集合(vertexs)：比如M集合中的每个元素都可以认为是一个独根树（是不是想到了并查集？）。2.边集合(edges)：对图中的每条边按照权值大小进行排序。（是不是想到了优先队列？）好了，下面该如何操作呢？... 阅读全文

posted @ 2012-12-17 00:28 一线码农阅读(6370) 评论(6) 推荐(3)

2012年12月16日

经典算法题每日演练——第十五题并查集

摘要：这一篇我们看看经典又神奇的并查集，顾名思义就是并起来查，可用于处理一些不相交集合的秒杀。一：场景有时候我们会遇到这样的场景，比如:M={1,4,6,8},N={2,4,5,7}，我的需求就是判断{1,2}是否属于同一个集合，当然实现方法有很多，一般情况下，普通青年会做出O(MN)的复杂度，那么有没有更轻量级的复杂度呢？嘿嘿，并查集就是用来解决这个问题的。二：操作从名字可以出来，并查集其实只有两种操作，并(Union)和查(Find)，并查集是一种算法，所以我们要给它选择一个好的数据结构，通常我们用树来作为它的底层实现。1.节点定义 1 #region 树节点 2 ... 阅读全文

posted @ 2012-12-16 15:00 一线码农阅读(5702) 评论(2) 推荐(2)

2012年12月12日

经典算法题每日演练——第十四题 Prim算法

摘要：图论在数据结构中是非常有趣而复杂的，作为web码农的我，在实际开发中一直没有找到它的使用场景，不像树那样的频繁使用，不过还是准备仔细的把图论全部过一遍。一：最小生成树图中有一个好玩的东西叫做生成树，就是用边来把所有的顶点联通起来，前提条件是最后形成的联通图中不能存在回路，所以就形成这样一个推理：假设图中的顶点有n个，则生成树的边有n-1条，多一条会存在回路，少一路则不能把所有顶点联通起来，如果非要在图中加上权重，则生成树中权重最小的叫做最小生成树。对于上面这个带权无向图来说，它的生成树有多个，同样最小生成树也有多个，因为我们比的是权重的大小。二：Prim算法求最小生成树的算法有很多... 阅读全文

posted @ 2012-12-12 19:12 一线码农阅读(7859) 评论(6) 推荐(3)

2012年12月9日

经典算法题每日演练——第十三题赫夫曼树

摘要：赫夫曼树又称最优二叉树，也就是带权路径最短的树，对于赫夫曼树，我想大家对它是非常的熟悉，也知道它的应用场景，但是有没有自己亲手写过，这个我就不清楚了，不管以前写没写，这一篇我们来玩一把。一：概念赫夫曼树里面有几个概念，也是非常简单的，先来看下面的图：1. 基础概念<1> 节点的权：节点中红色部分就是权，在实际应用中，我们用“字符”出现的次数作为权。<2> 路径长度：可以理解成该节点到根节点的层数，比如：“A”到根节点的路径长度为3。<3> 树的路径长度：各个叶子节点到根节点的路径长度总和，用WPL标记。最后我们要讨论的的赫夫曼树也就是带权路径长度最小的一棵阅读全文

posted @ 2012-12-09 14:27 一线码农阅读(7416) 评论(5) 推荐(7)

2012年12月8日

经典算法题每日演练——第十二题线段树

摘要：这一篇我们来看树状数组的加强版线段树，树状数组能玩的线段树一样可以玩，而且能玩的更好，他们在区间求和，最大，平均等经典的RMQ问题上有着对数时间的优越表现。一：线段树线段树又称"区间树”，在每个节点上保存一个区间，当然区间的划分采用折半的思想，叶子节点只保存一个值，也叫单元节点，所以最终的构造就是一个平衡的二叉树，拥有CURD的O(lgN)的时间。从图中我们可以清楚的看到[0-10]被划分成线段的在树中的分布情况，针对区间[0-N]，最多有2N个节点，由于是平衡二叉树的形式也可以像堆那样用数组来玩，不过更加耗费空间，为最多4N个节点，在针对RMQ的问题上，我们常常在每个节点上增加一阅读全文

posted @ 2012-12-08 00:37 一线码农阅读(4724) 评论(3) 推荐(2)

2012年12月6日

经典算法题每日演练——第十一题 Bitmap算法

摘要：在所有具有性能优化的数据结构中，我想大家使用最多的就是hash表，是的，在具有定位查找上具有O(1)的常量时间，多么的简洁优美，但是在特定的场合下：①：对10亿个不重复的整数进行排序。②：找出10亿个数字中重复的数字。当然我只有普通的服务器，就算2G的内存吧，在这种场景下，我们该如何更好的挑选数据结构和算法呢？一：问题分析这年头，大牛们写的排序算法也就那么几个，首先我们算下放在内存中要多少G: (10亿 * 32)/(1024*1024*1024*8)=3.6G，可怜的2G内存直接爆掉，所以各种神马的数据结构都玩不起来了，当然使用外排序还是可以解决问题的，由于要走IO所以暂时剔除，因为... 阅读全文

posted @ 2012-12-06 12:59 一线码农阅读(19396) 评论(30) 推荐(20)

2012年12月5日

经典算法题每日演练——第十题树状数组

摘要：有一种数据结构是神奇的，神秘的，它展现了位运算与数组结合的神奇魅力，太牛逼的，它就是树状数组，这种数据结构不是神人是发现不了的。一：概序假如我现在有个需求，就是要频繁的求数组的前n项和，并且存在着数组中某些数字的频繁修改，那么我们该如何实现这样的需求？当然大家可以往真实项目上靠一靠。① 传统方法：根据索引修改为O(1)，但是求前n项和为O(n)。②空间换时间方法：我开一个数组sum[]，sum[i]=a[1]+....+a[i]，那么有点意思，求n项和为O(1)，但是修改却成了O(N)，这是因为我的Sum[i]中牵涉的数据太多了，那么问题来了，我能不能在相应的... 阅读全文

posted @ 2012-12-05 12:50 一线码农阅读(7601) 评论(22) 推荐(8)

2012年12月3日

经典算法题每日演练——第九题优先队列

摘要：前端时间玩小爬虫的时候，我把url都是放在内存队列里面的，有时我们在抓取url的时候，通过LCS之类的相似度比较，发现某些url是很重要的，需要后端解析服务器优先处理，针对这种优先级比较大的url，普通的队列还是苦逼的在做FIFO操作，现在我们的需求就是优先级大的优先服务，要做优先队列，非堆莫属。一：堆结构 1:性质堆是一种很松散的序结构树，只保存了父节点和孩子节点的大小关系，并不规定左右孩子的大小，不像排序树那样严格，又因为堆是一种完全二叉树，设节点为i,则i/2是i的父节点，2i是i的左孩子，2i+1是i的右孩子，所以在实现方式上可以采用轻量级的数组。2：用途如果大家玩过微... 阅读全文

posted @ 2012-12-03 16:33 一线码农阅读(8473) 评论(4) 推荐(4)

2012年12月2日

经典算法题每日演练——第八题 AC自动机

摘要：上一篇我们说了单模式匹配算法KMP，现在我们有需求了，我要检查一篇文章中是否有某些敏感词，这其实就是多模式匹配的问题。当然你也可以用KMP算法求出，那么它的时间复杂度为O(c*(m+n))，c：为模式串的个数。m：为模式串的长度,n:为正文的长度，那么这个复杂度就不再是线性了，我们学算法就是希望能把要解决的问题优化到极致，这不，AC自动机就派上用场了。其实AC自动机就是Trie树的一个活用，活用点就是灌输了kmp的思想，从而再次把时间复杂度优化到线性的O(N)，刚好我前面的文章已经说过了Trie树和KMP，这里还是默认大家都懂。一：构建AC自动机同样我也用网上的经典例子，现有say sh.. 阅读全文

posted @ 2012-12-02 16:11 一线码农阅读(9522) 评论(3) 推荐(10)

公告