eastcowboy

 

2009年10月6日

一个让人疏忽的例子

摘要: char str[]="ab\01234";sizeof(str)=?strlen(str)=?我相信不少人不以为sizeof(str)=8,stlen(str)=2事实上是sizeof(str)=6,strlen(str)=5为什么是这个结果呢由于C编译器采用的是“贪心”法则,字符串中的‘\0’不是字符串的结束符,而‘\0’... 阅读全文

posted @ 2009-10-06 21:34 eastcowboy 阅读(277) 评论(1) 推荐(0) 编辑

2009年8月20日

内存对齐详解

摘要: 一、内存对齐的原因大部分的参考资料都是如是说的:1、平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。2、性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。二、对齐规则每个特定平台上的编译器都有自己的默认... 阅读全文

posted @ 2009-08-20 09:56 eastcowboy 阅读(628) 评论(0) 推荐(0) 编辑

2009年8月18日

A*算法的一份C语言实现品!

摘要: #include ”stdio.h“ #include “conio.h” #include ”assert.h“ #include“stdlib.h” #define MAPMAXSIZE 100 //地图面积最大为 100x100 #define MAXINT 8192 //定义一个最大整数, 地... 阅读全文

posted @ 2009-08-18 21:12 eastcowboy 阅读(349) 评论(0) 推荐(0) 编辑

[转载]中文分词免费源码资源

摘要: 1。http://www.chinesecomputing.com/nlp/segment.html此链接介绍了很多分词资源。注意看其第二项(ASimplified Chinese Segmenter written in Perl)。里面有Perl和Java版的简体中文分词程序,完全free。我试了一下,效果不错。网上很多人向Lucene中添加中文分词时用的都是中科院ICTCLAS的接口。而中科... 阅读全文

posted @ 2009-08-18 21:10 eastcowboy 阅读(297) 评论(0) 推荐(0) 编辑

Smoothing of Language Model

摘要: 本文主要让读者快速学习Language Model。语言模型最初在语音识别领域中应用,然后逐渐将起扩展到各个领域OCR、手写识别、统计机器翻译、拼写校正、信息检索等各个领域。基本Language Model 主要涉及(1) LM的定义.(2) N-gram作为LM的主要工具.下面所涉及都指N-gram(3) LM链式规则.(4) LM MLE(Maximum LikelihoodEstimatio... 阅读全文

posted @ 2009-08-18 21:08 eastcowboy 阅读(619) 评论(0) 推荐(0) 编辑

文本聚类

摘要: 摘要:常用聚类算法介绍ATutorial on Clustering Algorithms 阅读全文

posted @ 2009-08-18 21:06 eastcowboy 阅读(191) 评论(0) 推荐(0) 编辑

自然语言处理领域的相关算法!

摘要: 开始收集相关算法!1.PorterStemming算法(词干抽取) http://tartarus.org/~martin/PorterStemmer/ 里面有各个版本的词干抽取算法的实现。2.Lawrence Philips' Metaphone Algorithm http://aspell.net/metaphone/里面有各个版本此算法的实现!附一篇简要介绍此算法相关背景的文章An Int... 阅读全文

posted @ 2009-08-18 21:05 eastcowboy 阅读(870) 评论(0) 推荐(0) 编辑

百度笔试

摘要: 题目大致是这样的:第一部分选择题:有几道网络相关的题目,巨简单,比如第一题是TCP、RIP、IP、FTP中哪个协议是传输层的......。有一道linux的chown使用题目。其他的全是数据结构的题目!什么链,表,码的,不知所云~~~唉,我可以没有学过数据结构的人呐!真残忍!这一部分迅速猜完! 第二部分简答题: 1、在linux中如何编译C程序,使之成为可执行文件?如何调试?答案:1)检查程序中.... 阅读全文

posted @ 2009-08-18 20:53 eastcowboy 阅读(550) 评论(0) 推荐(1) 编辑

2009年8月8日

反射之反思

摘要: 转自: http://msdn.microsoft.com/msdnmag/issues/07/06/CLRInsideOut/default.aspx?loc=en清晰的组件化目标是否因在库间共享过多类型信息而落空?或许您需要高效的强类型化数据存储,但如果每次对象模型发展后都需要更新您的数据库架构,那会耗费很大成本,所以您更愿意在运行时推断出其类型架构吗?您需要交付能接受任意用户对象的组件,并以... 阅读全文

posted @ 2009-08-08 09:32 eastcowboy 阅读(157) 评论(0) 推荐(0) 编辑

2009年5月24日

[转] ASP.NET 2.0个性化配置(profile)

摘要: 为每个用户存储配置信息 以前保存用户配置信息时用到的是session和cookie。session会话结束,保存的个人信息就会丢失,而cookie在一定程度上存在安全隐患asp.net 2.0引入的profile技术 可以很好的解决该问题。强类型 长期保存支持匿名用户定义配置(profile) <?xmlversion="1.0"?><configurationxmlns="ht... 阅读全文

posted @ 2009-05-24 09:52 eastcowboy 阅读(415) 评论(0) 推荐(0) 编辑

导航