随笔分类 -  字符编码

摘要:猛然间看到这篇文章,才发现原来自己理解的uniocde还是表面,这篇文章又说明了很多深层次的内容,值得一看。 Python 3000决定采用Unicode作为字符的默认编码。这不是什么新闻了,也是国际化的大势所趋。但实际上似乎没有那么简单。最近python-dev邮件列表吵的一个问题就很有意思。 阅读全文
posted @ 2009-12-16 14:41 木瓜脑袋 阅读(964) 评论(0) 推荐(0)
摘要:本文内容参考 The Bidiretional Algorithm 本文并不是对The Bidirection Algorithm的翻译,而是将比较常碰到的问题摘录下来。同时从比较简单的例子来说明这个算法是应用的。因此也并没有覆盖里面所讲的每一个细节。同时比较可以借鉴的是我对算法的理解(当然,也有可能因理解的不准确而有偏差)。 目前网页的排版基本上分成LTR... 阅读全文
posted @ 2009-12-16 09:02 木瓜脑袋 阅读(844) 评论(0) 推荐(0)
摘要:毫无疑问,我们都看到过像 TCHAR, std::string, BSTR 等各种各样的字符串类型,还有那些以 _tcs 开头的奇怪的宏。你也许正在盯着显示器发愁。本指引将总结引进各种字符类型的目的,展示一些简单的用法,并告诉您在必要时,如何实现各种字符串类型之间的转换。 在第一部分,我们将介绍3种字符编码类型。了解各种编码模式的工作方式是很重要... 阅读全文
posted @ 2009-12-11 23:31 木瓜脑袋 阅读(969) 评论(0) 推荐(0)
摘要:Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。随着计算机工作能力的增强,Unicode也在面世以来的十多年里得到普及。 阅读全文
posted @ 2009-12-09 16:45 木瓜脑袋 阅读(2330) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2009-11-24 10:49 木瓜脑袋 阅读(1231) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2009-11-24 10:33 木瓜脑袋 阅读(791) 评论(0) 推荐(0)
摘要:在修改一个cms的过程当中遇到一个php截取字符串的函数(当然得兼容中英字符了),因为对各种编码的字符范围和字符表示不清楚,感觉一头迷雾,虽然可以直接来调用这个函数,但是我这个的特点是追究原理,我在乎的事情都想弄明白,于是各个qq群依次发信息,没人理会。唉,郁闷。只好自己google it and teach myself 。下面是详细介绍。 还有对各方求助没有人理会,我有些个人想法。现在的人已... 阅读全文
posted @ 2009-11-13 10:46 木瓜脑袋 阅读(2589) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2009-10-20 08:49 木瓜脑袋 阅读(3582) 评论(0) 推荐(0)