2012年1月7日

摘要: 09年的时候,我用C#实现了简单的飞信协议,并开了源,详情请查看这里。直到现在还有童鞋发邮件给我向咨询或是所要代码。但是由于飞信协议有个几次的升级,我那个库基本上没什么用了。由于工作比较忙,也一直没有去管他。前两天,我用这个项目申请了sinaapp的中级开发者人证,居然侥幸通过了,所以觉得有必要更新一下代码了。网上查了一下有关飞信协议的最新的情况,没有什么进展,我也不想自己通过抓包去分析飞信协议了,毕竟那样会比较耗时。正当我准备放弃的时候发现有人用php实现了wap飞信的协议。不看不知道,一看吓一跳,协议非常简单,总共代码也不超过100行。我花了一小段时间,将那php的代码翻译成了C#的,测试 阅读全文
posted @ 2012-01-07 18:49 小橋流水 阅读(43421) 评论(29) 推荐(6) 编辑

2012年1月6日

摘要: 很多时候想通过.NET调用一些C/C++写的库,但是一直都不知道怎么弄。去网上找了一些资料,大多数是教如何通过托管C++和非托管C++的混合编程来完成C/C++的的类库的.NET Wrapper。有的时候用C#来实现一个功能的时候,可能要调用windows api,往往都是到网上现查代码,然后粘过来使用,没有细研究到底是怎么做到的。最近一个朋友用到分词,所以就研究了一些中科院提供的中文分词软件,详情请访问http://ictclas.org/。用了一下还挺好用的,速度没有测试,感觉应该用于学术研究肯定是没有问题的,如果要用到项目中,我觉得还是公司自己实现会比较好。可惜该组件没有提供.NET的版 阅读全文
posted @ 2012-01-06 01:03 小橋流水 阅读(40688) 评论(1) 推荐(1) 编辑

2012年1月3日

摘要: 最近想平均分割一个数组,比如把一个10数的数组分成6个数组的,最好的分法是2,2,2,2,1,1,这个2很好求出,直接10/6上取整就可以了,但是如果按2去分割的话,最后会变成2,2,2,2,2,0这样不均匀的分法,很是蛋疼。今天休息,想了一下这个问题,发现可以用递归来解决。比如先分出2来,递归将8分成5个数组,有能分出2来,递归将6分成4个数组,在分出2来,变成了递归将4分成3个数组,又可以分出2来,那就变成了将2分成2个数组,下一步就很明显了。不多说了,直接上码,希望对遇到同问题的人有所帮助,这也算我的功德了。View Code #include<iostream>#inclu 阅读全文
posted @ 2012-01-03 16:22 小橋流水 阅读(41544) 评论(4) 推荐(2) 编辑

2011年12月24日

摘要: 在shell下,可以直接创建文件的硬链接,而符号链接(软链接)可以对文件和目录。很多情况下,直接用软链接就可以搞定。但在有的时候,单纯的软链接是解决不问题的。 但是对于目录来说又不能创建硬链接,那肿么办呢? 把目录中所有的文件都硬链接过来。 阅读全文
posted @ 2011-12-24 22:41 小橋流水 阅读(40496) 评论(0) 推荐(1) 编辑

2011年12月22日

摘要: hadoop streaming示例:${HADOOP_BIN}streaming\r-Dmapred.job.name=${JOB_NAME}#任务名-Dstream.memory.limit=1500#任务内存限制-Dmapred.map.capacity.per.tasktracker=1\r-Dmapred.reduce.capacity.per.tasktracker=1\r-Dmapred.map.tasks=${MAP_TASKS}#map个数-Dmapred.job.map.capacity=${MAP_CAPACITY}#map容量,一般与map个数一致-Dmapred.re 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(40467) 评论(0) 推荐(0) 编辑
摘要: 前两天Google的*.appspot.com被和谐后,广大墙友的GappProxy就用不了了,不过通过自己绑定域名的GAE却可以正常访问,所以我想,通过自定绑定的域名来使用GAppProxy应该也是可以的,待我使用最新版的GAppProxy2时,却无情的收到404错误: Error response Error code 404. Message: Local proxy error, Fetchserver not found at the URL you specified, please check it.. Error code explanation: 404 = N... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(39957) 评论(0) 推荐(0) 编辑
摘要: java中提供很多集合类,比如ArrayList,HashMap等等。但你有没有发现其中的这些集合类都是泛型的,有的时候你会发现用泛型会比较慢。慢在哪呢?慢就慢在基本类型的装包和拆包。当你处理大数量的时候,这个慢有的时候就不能接受了。那这怎么解决呢?推荐大家使用fastutil,一个意大利实验室出品,主要用在其的WebGraph上。下面是其官方网站对其的介绍:fastutil extends the Java™ Collections Framework by providing type-specific maps, sets, lists and queues with a small m 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(40401) 评论(0) 推荐(0) 编辑
摘要: linux下线程采用pthread.h,采用的是c语言的风格,为了更加面向对象话,我在写程序的时候给封装成了一个类,用到了一些内部的库,但是去掉内部的库,也无伤大雅。懒得去改程序了,所以没有去处某些内部的头文件和函数的调用。thread.h/***@filethread.h*@version*@date2011/5/12*@authorwangyou@baidu.com*@brief对线程进行了简单的封装(java风格)**/#pragmaonce#include#include//线程classthread{public:/***@brief构造函数*@param无*@return无**/t 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(41365) 评论(0) 推荐(0) 编辑
摘要: 大连理工大学部分有效FTP地址列表[V1.0]地址格式:ftp://账号:密码@服务器IP:端口号建议使用FlashFXP登录FTPftp://ftp.dlut.edu.cnftp://210.30.96.4ftp://210.30.96.5ftp://ssdut:download@210.30.96.116ftp://ssuser:ssuser@210.30.97.149ftp://cippus:cippus@210.30.97.150ftp://ssdut:download@210.30.98.67ftp://ssdut:ssdut@crazyso.3322.orgftp://cti.dl 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(41858) 评论(0) 推荐(0) 编辑
摘要: 工作的时候进程需要手工去check服务器的运行状况,有的时候要check很多台,手工的话,就很繁琐,而且也容易出错。 我就想着写一个脚本来完成,想法是脚本通过ssh连上远程服务器,然后运行命令,返回结果。 但是发现需要一个一个输入密码,这也很郁闷,网上找了找,发现可以添加认证关系,但是如果手工一台一台的添加的话,也要花费不少时间。而且添加人证关系的过程也是比较繁琐的。 我就想能不能用命令指定密码,... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(40136) 评论(0) 推荐(0) 编辑
摘要: stl提供各种各样的容器,大家都感受到了它给我们带来的方便,但是它也存在一定的问题。刚来百度的时候,查看编码规范的时候,看到一条建议不要使用stl,而使用百度自己的bsl,原因是stl的内存不可控,不太适合百度的线上服务。当时不了解这句话的真正含义,只是记住了,甚至在后来用的时候,发现其实bsl就是将stl改吧改吧,并没有觉得有什么好的,而且用起来还没有stl方便。只是在做新人题的时候,试着去用b... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(611) 评论(0) 推荐(0) 编辑
摘要: 在别人的代码中看到的,看来还是有一点作用的,代码如下:#include using namespace std;int quickfindonecnt(int i){ int cnt = 0; while (i) { cnt++; i &= i-1; } return cnt;}int main(){ int i = 0xFFF; cout << quickfindonecnt(i) << e... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(486) 评论(0) 推荐(0) 编辑
摘要: ls -al 1>/dev/null 2>&1 ls -al就是显示当前目录的信息,1>/dev/null是叫标准输出重定向到/dev/null,即空,2>&1,就是将标准错误输出合并到标准输出。也就是将所有的输出都输出到/dev/null,即不输出任何信息。 另外,我们也可以将输出重定向到文件ls -al 1>1.txt 2>2.txt,将标准输出重定向1.txt,标准错误输出重定向2.txt ... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(243) 评论(0) 推荐(0) 编辑
摘要: mxr.mozilla.org是mozilla的代码查看网站,上面有丰富的代码资源,但是上边没有打包下载的功能,只能单个单个文件的下载,用起来会非常的麻烦。今天没啥事,想研究一下firefox的编码识别模块,需要到mxr.mozilla.org上去下载代码。去网上找了一圈也没有找到批量下载的方法或工具。本想一个一个文件下载,但是发现文件数量还是比较大的,很麻烦,所以决定写个工具来下载。工具用C#写... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(372) 评论(0) 推荐(0) 编辑
摘要: 很多同学正在面临或即将面临找工作的问题,很多人对自己想要从事的行业不是很了解。做为软件学院的同学大多数要去软件公司、游戏公司和互联网公司。我就我比较了解的互联网公司的几个跟技术有关的职位做一定的科普,希望对大家有一定的帮助,大牛请绕道。 RD(Research&Development),即研发,其实就是软件工程师,或者叫程序员、码农。我们软件学院的大多数人都将从事这个职位,主要任务就是写代码,当... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(779) 评论(0) 推荐(0) 编辑
摘要: 题目:实现int add(int a, int b)方法,实现a和b的和,但是内部不允许使用+-*/等算术运算。 解答:这个题考查的其实是对计算机硬件如何做加法的。计算机内做加法和乘法都是模拟人做加法和乘法的方法来设计和实现cpu算术运算模块的。这在我们学习计算机组成原理的课程时应该学到过。如下面例子: 1101 11+--------------10000 这个计算可以分为两部分,一部分是按位+... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(772) 评论(0) 推荐(0) 编辑
摘要: 伪原创对与百度和搜搜等国内搜索引擎来说,效果很好,但是谷歌貌似对很少会把伪原创的东西排上来。比如你搜一篇博客,在百度出来90%的第一条不是原创的内容,很有可能是转载的或是伪原创的,但是谷歌貌似在这方面做得很好。在网上搜了搜关于伪原创的东西,发现有好多软件,说明这个行业还是很有市场的。从百度文库搞到一个伪原创的同义词表,作弊和反作弊的都可以看看,也许能挖掘一些规则什么的。52537条伪原创词库 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(503) 评论(0) 推荐(0) 编辑
摘要: 后溪最早见于《黄帝内经•灵枢•本输》篇,为手太阳小肠经的输穴,又为八脉交会之一,通于督脉小肠经。有舒经利窍、宁神之功。适合经常坐在电脑前的上班族、发育中的孩子,可预防驼背、颈椎、腰部、腿部疼痛,也有保护视力、缓解疲劳、补精益气的功效。 后溪穴的位置如下图所示。 我们想想,当我们坐在电脑旁阅读文件的时候,手是怎么放的?肯定是一手不离鼠标,一手仍在键盘上吧!保持这个姿势不动,人都变僵了。这时,不妨... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(501) 评论(0) 推荐(0) 编辑
摘要: 1、一个随机数产生器以概率p生成0,以概率(1-p)生成1,怎样生成等概率的0和1? 如果用这个随机数产生器产生两个位,出现00的概率为,出现01的概率为,出现10的概率为,出现11的概率为。看到没有,出现01和10的概率相等。那么我们就可以用这个随机数生成器每次产生2位,直到产生的是01或者10,当为01时,输出0,当为10时输出1。 问题扩展:还是给这么一个随机数产生器,要求等概率地产生。 解... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(597) 评论(0) 推荐(0) 编辑
摘要: Given a matrix in which each row and each column is sorted, write a method to find an element in it. Assumptions:»»Rows are sorted left to right in ascending order. Columns are sorted top to bottom in... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(157) 评论(0) 推荐(0) 编辑

导航