前面提到过,GSM SMS可以采用7 bits的编码方式,从而在1120 bits的长度里可以容纳160个字符。但有一点没有说清楚(或者说得不正确),理论上ASCII字符集的前127个字符都可以采用这种方式编码,但事实却不是如此。最明显的一个例子是[,ASCII编码为0x5B,但在GSM SMS中却是用两个7 bits来表示。所以当你编辑短信输入[(或者])的时候,就会很奇怪的发现,短信的长度多了14个bits,相当于是两个普通字符的长度。所以,GSM SMS的文字编码和ASCII编码并不是一一对应的,这里有一张完整的列表。
这些奇怪的字符被称之为GSM Extension Characters,更多的情况是,不少的手机根本没有对它们进行特别的处理,而是一看得这些字符,就统统转成UCS2,这也算是一个偷懒省事的做法。
浙公网安备 33010602011771号