摘要: #define doit(name) pr_limits(#name,name) #name 中的#为name 创建字符窜对unix系统中的一些比如最大创建文件名字大小这些系统设定的硬性标准,都可以通过程序进行设定,然后由主进程进行规定,子进程共享这些规定。这个时候对于系统和变量的判别就需要用到#if defined ,#define ,#endif这些条件编译。 阅读全文
posted @ 2012-08-23 22:07 gui__li 阅读(158) 评论(0) 推荐(0)
摘要: setvbuf是设置缓存的语句。将流与数组或者系统设置的数组进行挂钩。将数组作为缓存的一个操作。 setjmp是在多重调用的嵌套下,迅速返回指定位置的语句。和goto 的用法差不多,但是goto只是限于同层调用的。setjmp是用于嵌套调用。 阅读全文
posted @ 2012-08-22 22:10 gui__li 阅读(120) 评论(0) 推荐(0)
摘要: 1:先将大数据量大文本的东西粗略的处理一下,大致分一下类,然后再在这个基础上细分,不要一上来就细分。2:数学在计算机里面是很有用的,要多加练习。粗浅的认识为算法。3:sourceinsight是个很好的代码查看器 4:要经常查看自己写的代码,这样可以更好的改进自己的代码水平。 阅读全文
posted @ 2012-08-14 23:01 gui__li 阅读(165) 评论(0) 推荐(0)
摘要: 开发一个搜索引擎,要有下载网页,索引,网页质量,网页与关键词的相关性四个方面。 第一个下载网页方面是网络爬虫的问题,是个DFS和BFS的交叉性的问题。 索引是建立颗粒度和快速查找的依据,也是布尔代数的基础。 网页质量是采用了Pagerank算法。民主表决,很多人链接的网页,这个网页的质量就高。 链接数矩阵和等值矩阵不断迭代,然后逼近真正的网页质量,据检测,经过10次之后,大致变化就不大了。 网页和关键词的相关性---采用了TF-IDF的方法,理论为:将关键词拆分,然后拆分的词的频率*权值的和。信息论的依据还有相关的公式。信息量越多,TF-IDF值越大,而在命中的文献中平均出现的次... 阅读全文
posted @ 2012-08-07 23:09 gui__li 阅读(194) 评论(0) 推荐(0)
摘要: 数学之美以浅显易懂的方式向我讲述了很多现在前沿性的问题。为我阐释了很多复杂的问题其实很简单,分成几个阶段,然后每个阶段再仔细研究。 从文字和语言vs 数字和信息中两者之间的联系。都是用来记载信息的。用于交流的。 自然语言处理和通信方式的相同,从规则的计算的复杂性然后转到统计规则的必然,然后统计中如何选取更好的模版。 统计语言模型先用大方面介绍了选取概率比较的大的结果,然后是条件概率,并且对概率小于一定阀值的概率事件做平滑处理。 然后接着谈到中文分词,具体到了中文分词中的概率统计。提出了一个词的颗粒性概念。 隐含马尔可夫模型,通信中的一个模型,用到了自然语言处理,这个是从编码到解码的统计概率.. 阅读全文
posted @ 2012-08-05 22:45 gui__li 阅读(218) 评论(0) 推荐(0)
摘要: object=test.o ExShell.oall:libExShell.so test $(object)test:test.og++ -o $@ $^ -L. -lExShell .cpp.o:g++ -c -fPIC $<libExShell.so:ExShell.og++ -fPIC -shared -o $@ $^clean:@rm *.o test libExShell.so这是一个项目中的makefile.很简单的一个makefile.文件有ExShell.cpp,ExShell.h,test.cpp.生成动态链接库的一个简单makefile第一行是变量定义第二行是mak 阅读全文
posted @ 2012-07-28 17:05 gui__li 阅读(4535) 评论(0) 推荐(0)
摘要: 在经济学的基础上,有着大众的经济学原理,也有着性格这方面的考量。里面提到了偏好,其实我感觉更多的解释应该是性格。暂且叫做偏好吧,偏好是有成本的,如果高于那个成本,很多人就不愿意去做了。这个就是我们每个人能接受的范围。或者说有人重情,有人对感情看得不中,只是两个人的临界值不同而已。这个可以用作以后分析问题,与人交流的时候用到。 阅读全文
posted @ 2012-07-25 23:07 gui__li 阅读(215) 评论(0) 推荐(0)
摘要: 来自:http://zhidao.baidu.com/question/51730260.htmlRSA算法非常简单,概述如下: 找两素数p和q 取n=p*q 取t=(p-1)*(q-1) 取任何一个数e,要求满足e<t并且e与t互素(就是最大公因数为1) 取d*e%t==1 这样最终得到三个数: n d e 设消息为数M (M <n) 设c=(M**d)%n就得到了加密后的消息c 设m=(c**e)%n则 m == M,从而完成对c的解密。 注:**表示次方,上面两式中的d和e可以互换。 在对称加密中: n d两个数构成公钥,可以告诉别人; n e两个数构成私钥,e自己保留,不让 阅读全文
posted @ 2012-07-25 14:31 gui__li 阅读(441) 评论(0) 推荐(0)
摘要: http://www.cnblogs.com/tgkx1054/archive/2012/07/24/2607399.html 对于其中的这句话:如果要同时找出最大值和最小值,则比较次数最少并不是2*n-2,而是,我们可以将一对元素比较,然后把较大者于max比较,较小者与min比较,这样就只需要。 3/2*n这个算法是先将奇数位和偶数位的数据比较交换,奇数位保存大数,偶数位保存小数,然后奇数位再比较交换,偶数位再单独比较交换。然后就只需要3/2n 还可以2*logn log为2为底,n的对数 阅读全文
posted @ 2012-07-24 23:53 gui__li 阅读(144) 评论(0) 推荐(0)
摘要: 1)确定密钥的宽度 2)随机选择两个不同的素数p和q,他们的宽度是密钥宽度的二分之一。 3) 计算出p和q的乘积n。 4)在2和n的函数之间随机选择一个数e,e必须和n的函数值互素,整数e用做加密密钥(n的函数=(p-1)*(q-1)) 5) 从公式ed恒等于1mod n的函数 中求出解密密钥d。 6)得公钥(e,n),私钥(d,n) 7) 公开公钥,但不公开私钥 8)将明文P(假设p是一个小于n的整数)加密为密文C,计算方法为: c=(p的e次方)mod n 9)将密文C解密为明文P,计算方法为: P=(c的d次方)mod n 然而只... 阅读全文
posted @ 2012-07-23 21:46 gui__li 阅读(377) 评论(0) 推荐(0)