2012年1月7日

摘要: 09年的时候,我用C#实现了简单的飞信协议,并开了源,详情请查看这里。直到现在还有童鞋发邮件给我向咨询或是所要代码。但是由于飞信协议有个几次的升级,我那个库基本上没什么用了。由于工作比较忙,也一直没有去管他。前两天,我用这个项目申请了sinaapp的中级开发者人证,居然侥幸通过了,所以觉得有必要更新一下代码了。网上查了一下有关飞信协议的最新的情况,没有什么进展,我也不想自己通过抓包去分析飞信协议了,毕竟那样会比较耗时。正当我准备放弃的时候发现有人用php实现了wap飞信的协议。不看不知道,一看吓一跳,协议非常简单,总共代码也不超过100行。我花了一小段时间,将那php的代码翻译成了C#的,测试 阅读全文
posted @ 2012-01-07 18:49 小橋流水 阅读(43419) 评论(29) 推荐(6) 编辑

2012年1月6日

摘要: 很多时候想通过.NET调用一些C/C++写的库,但是一直都不知道怎么弄。去网上找了一些资料,大多数是教如何通过托管C++和非托管C++的混合编程来完成C/C++的的类库的.NET Wrapper。有的时候用C#来实现一个功能的时候,可能要调用windows api,往往都是到网上现查代码,然后粘过来使用,没有细研究到底是怎么做到的。最近一个朋友用到分词,所以就研究了一些中科院提供的中文分词软件,详情请访问http://ictclas.org/。用了一下还挺好用的,速度没有测试,感觉应该用于学术研究肯定是没有问题的,如果要用到项目中,我觉得还是公司自己实现会比较好。可惜该组件没有提供.NET的版 阅读全文
posted @ 2012-01-06 01:03 小橋流水 阅读(40685) 评论(1) 推荐(1) 编辑

2012年1月3日

摘要: 最近想平均分割一个数组,比如把一个10数的数组分成6个数组的,最好的分法是2,2,2,2,1,1,这个2很好求出,直接10/6上取整就可以了,但是如果按2去分割的话,最后会变成2,2,2,2,2,0这样不均匀的分法,很是蛋疼。今天休息,想了一下这个问题,发现可以用递归来解决。比如先分出2来,递归将8分成5个数组,有能分出2来,递归将6分成4个数组,在分出2来,变成了递归将4分成3个数组,又可以分出2来,那就变成了将2分成2个数组,下一步就很明显了。不多说了,直接上码,希望对遇到同问题的人有所帮助,这也算我的功德了。View Code #include<iostream>#inclu 阅读全文
posted @ 2012-01-03 16:22 小橋流水 阅读(41542) 评论(4) 推荐(2) 编辑

2011年12月24日

摘要: 在shell下,可以直接创建文件的硬链接,而符号链接(软链接)可以对文件和目录。很多情况下,直接用软链接就可以搞定。但在有的时候,单纯的软链接是解决不问题的。 但是对于目录来说又不能创建硬链接,那肿么办呢? 把目录中所有的文件都硬链接过来。 阅读全文
posted @ 2011-12-24 22:41 小橋流水 阅读(40490) 评论(0) 推荐(1) 编辑

2011年12月22日

摘要: 自2011年初,CSDN在网上发起“2011年软件行业技术人员薪资大调查”以来,引起了广大开发者们的热烈反响,短短两月时间内,近万名开发者提交了调查数据。尽管这只是中国百万开发者大军的一小部分,但他们所在的行业几乎涵盖了整个中国软件的产业链,他们的职位几乎代表了一个软件团队体系的每一个层面,而且 “一叶知秋”,所以透过这些调查数据和变化,我们或许可以一瞰中国软件开发者的普遍生存状态,甚至可帮助开发... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 在百度实习已经三个多月了。我但是就计划在百度实习三个月,然后到其他的公司,去感受不同的企业文化。百度其实挺好的,我在这里的三个月学到了太多太多的东西。 刚来的两周时间,压力非常的大,以前基本上没有接触到linux,到了百度后,首先就是要做新人题。从设计到代码,单测都要独立完成。这个过程非常折磨人,周末的时候,我都在写代码的,学会了使用各种各样的的内部库,学会了单测,学会了Makefile,学... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(251) 评论(0) 推荐(0) 编辑
摘要: 个人目录下: Web Crawled by myself # 自己爬取的数据集 cn 5 depth # 用nutch 0.7.2爬取的数据集,限制在cn域中,包括链接和文本 cn-2010-01-01 # 用nutch 0.7.2爬取的数据集,限制在cn域中,包括链接和文本 dlut.edu.cn2010-01-01 # 用nutch 0.... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(903) 评论(0) 推荐(0) 编辑
摘要: 导航类的查询是指那些有明确寻址需求的查询,如“优酷网”或“优酷”等。目前很多互联网用户很可能只能记得百度等搜索引擎的网址,或把百度设置为首页,要进别的网站时,一般通过搜索来解决。 在搜索引擎中,对于导航类的查询,如果返回的第一条搜索结果不是目标网站的话,对用户的搜索体验是巨大的伤害。比如搜索“中国银行”,如果返回的不是中国银行的网站,而是某钓鱼网站的话,那很有可能对用户造成非常的伤害。因此,很有必... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 今天qq上一个师弟向我咨询实习相关的问题。关于实习,其实也一直有很多话要说。我是今年5月份出来实习的,一直到现在,已经7个月了,4个月在百度联盟研发部,剩下的三个月在腾讯soso。这个过程中既有欢笑,也有茫然和痛苦。我在收获实习工资(虽然不是很多)的同时,得到了巨大的成长。 我这个人最大的特点是喜欢钻研,我并不是个很聪明的人,也不太善于与人交流,但我喜欢钻研问题,但往往在面试的过程中别人了解不到我... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(397) 评论(1) 推荐(1) 编辑
摘要: 1、窃听入侵者搭线窃听,试图从正在进行的通信中获得有用的信息。 2、重放入侵者记录过去通信中的消息并在以后的通信中重放它们。 3、中间人攻击入侵拦截各主体之间的消息,并用自己的消息来取代它们。在向服务器发送的消息中他假冒用户的身份,同样,在向用户发送的消息中他假冒服务器的身份。 4、口令猜测攻击假设入侵者拥有一个相对较小的口令字典,其中包含了许多普通的口令。利用该口令字典,入侵者主要用以下两种方法... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(1111) 评论(0) 推荐(0) 编辑
摘要: 昨天一个同学来公司面试,是我推荐的。面试官是我的两个同事,他们出了一道题,将一个float转成string。我的那个同学没有写出来,回来后问我的想法,我花了几分钟的时间,粗略写了一下,代码如下:#include #include using namespace std;string flot2str(float f){ if (f == 0) return "0"; string s; int ... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(1865) 评论(0) 推荐(0) 编辑
摘要: Write a method to compute all permutations of a string. 翻译:写一个计算一个字符串所有排列的算法。 [方法1] 递归的方法 首先字符串分为a[0,1,...,n-2]和a[n-1]两部分,然后将递归求解a[0,1,...,n-2]的所有排列,最后将a[n-1]插入到a[0,1,...,n-2]的所有排列中去(注意一共有n个插入点) 代码如下... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(248) 评论(0) 推荐(0) 编辑
摘要: 昨天去小米笔试了,其中一道大题是求一个字符串的所有排列,如“AAB”的所有排列为{“AAB”、“ABA”,“BAA”},这道题在我之前的博客中有研究过,所以不赘述,请查看这里。 另外一道题是给定一些线段,线段有起点和终点,求这些线段覆盖的距离,重复的部分只计算一次。这道题其实应该也算比较easy了,昨天笔试的时候,写得有点复杂了。今天整理了一下思路:首先排序,起点低的在前面,起点相同的按终点排。然... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(651) 评论(0) 推荐(0) 编辑
摘要: WordPress有一个社交媒体连接的插件,可以将博客更新同步到微博,但很可惜的是不能同步到人人网,本打算自己修改添加一下这个功能。到网上找资料,发现人人网有一个日志的导入功能。就在发布日志的那个页面的右下角。导入时,填入你的博客的地址,我填的是我的博客的rss地址。第一次导入,会让你选择需要导入的日志,以及哪些人可以查看。据说,以后,当检测到你的博客有更新的话,也会同步到人人网上。这个功能还是比较方便的,省去了自己开发插件了。具体位置如下图: 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(383) 评论(0) 推荐(0) 编辑
摘要: 伪原创对与百度和搜搜等国内搜索引擎来说,效果很好,但是谷歌貌似对很少会把伪原创的东西排上来。比如你搜一篇博客,在百度出来90%的第一条不是原创的内容,很有可能是转载的或是伪原创的,但是谷歌貌似在这方面做得很好。在网上搜了搜关于伪原创的东西,发现有好多软件,说明这个行业还是很有市场的。从百度文库搞到一个伪原创的同义词表,作弊和反作弊的都可以看看,也许能挖掘一些规则什么的。52537条伪原创词库 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(502) 评论(0) 推荐(0) 编辑
摘要: java中提供很多集合类,比如ArrayList,HashMap等等。但你有没有发现其中的这些集合类都是泛型的,有的时候你会发现用泛型会比较慢。慢在哪呢?慢就慢在基本类型的装包和拆包。当你处理大数量的时候,这个慢有的时候就不能接受了。那这怎么解决呢?推荐大家使用fastutil,一个意大利实验室出品,主要用在其的WebGraph上。下面是其官方网站对其的介绍:fastutil extends the Java™ Collections Framework by providing type-specific maps, sets, lists and queues with a small m 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(40386) 评论(0) 推荐(0) 编辑
摘要: linux下线程采用pthread.h,采用的是c语言的风格,为了更加面向对象话,我在写程序的时候给封装成了一个类,用到了一些内部的库,但是去掉内部的库,也无伤大雅。懒得去改程序了,所以没有去处某些内部的头文件和函数的调用。thread.h/***@filethread.h*@version*@date2011/5/12*@authorwangyou@baidu.com*@brief对线程进行了简单的封装(java风格)**/#pragmaonce#include#include//线程classthread{public:/***@brief构造函数*@param无*@return无**/t 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(41361) 评论(0) 推荐(0) 编辑
摘要: 大连理工大学部分有效FTP地址列表[V1.0]地址格式:ftp://账号:密码@服务器IP:端口号建议使用FlashFXP登录FTPftp://ftp.dlut.edu.cnftp://210.30.96.4ftp://210.30.96.5ftp://ssdut:download@210.30.96.116ftp://ssuser:ssuser@210.30.97.149ftp://cippus:cippus@210.30.97.150ftp://ssdut:download@210.30.98.67ftp://ssdut:ssdut@crazyso.3322.orgftp://cti.dl 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(41850) 评论(0) 推荐(0) 编辑
摘要: 工作的时候进程需要手工去check服务器的运行状况,有的时候要check很多台,手工的话,就很繁琐,而且也容易出错。 我就想着写一个脚本来完成,想法是脚本通过ssh连上远程服务器,然后运行命令,返回结果。 但是发现需要一个一个输入密码,这也很郁闷,网上找了找,发现可以添加认证关系,但是如果手工一台一台的添加的话,也要花费不少时间。而且添加人证关系的过程也是比较繁琐的。 我就想能不能用命令指定密码,... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(40135) 评论(0) 推荐(0) 编辑
摘要: stl提供各种各样的容器,大家都感受到了它给我们带来的方便,但是它也存在一定的问题。刚来百度的时候,查看编码规范的时候,看到一条建议不要使用stl,而使用百度自己的bsl,原因是stl的内存不可控,不太适合百度的线上服务。当时不了解这句话的真正含义,只是记住了,甚至在后来用的时候,发现其实bsl就是将stl改吧改吧,并没有觉得有什么好的,而且用起来还没有stl方便。只是在做新人题的时候,试着去用b... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(609) 评论(0) 推荐(0) 编辑

导航