随笔分类 -  编码相关

字符、字符集、代码点、字符集编码、java字符等相关知识
Java字符相关知识
摘要:以Q&A的方式总结Java字符相关知识字符编码基本概念:Q: 什么是字符?A:字符(character)是抽象的最小文本单位。它没有固定的形状(可能是一个字形),而且没有值。“A”是一个字符,“严”是一个字符,“€”(德国、法国和许多其他欧洲国家通用货币的标志)也是一个字符。Q: 什么是字符集?A:字符集(character set)是字符的集合。例如,汉字字符是中国人最先发明的字符,在中文、日文、韩文和越南文的书写中使用。Q:什么是编码字符集?A:编码字符集(coded characterset)是一个字符集,它为每一个字符分配一个唯一数字。Unicode 标准的核心是一个编码字符集,字母“ 阅读全文

posted @ 2010-12-29 22:06 NanguoCoffee 阅读(1295) 评论(0) 推荐(1)

[转]Java编码浅析(注意区分三个概念)
摘要:PS: 转自http://www.javaeye.com/topic/311583Java与Unicode:Java的class文件采用utf8的编码方式,JVM运行时采用utf16。Java的字符串是unicode编码的。总之,Java采用了unicode字符集,使之易于国际化。Java支持哪些字符集:即Java能识别哪些字符集并对它进行正确地处理?查看Charset类,最新的JDK支持160种字符集。可以通过static方法availableCharsets拿到所有Java支持的字符集。Java代码assertEquals(160,Charset.availableCharsets().s 阅读全文

posted @ 2010-11-24 17:40 NanguoCoffee 阅读(998) 评论(0) 推荐(0)

【转】字符编码笔记:ASCII,Unicode和UTF-8
摘要:作者:阮一峰日期:2007年10月28日今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料。结果,这个问题比我想象的复杂,从午饭后一直看到晚上9点,才算初步搞清楚。下面就是我的笔记,主要用来整理自己的思路。但是,我尽量试图写得通俗易懂,希望能对其他朋友有用。毕竟,字符编码是计算机技术的基石,想要熟练使用计算机,就必须懂得一点字符编码的知识。1. ASCII码我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以 阅读全文

posted @ 2010-11-24 17:24 NanguoCoffee 阅读(680) 评论(0) 推荐(0)

[转]java中byte转换int时为何与0xff进行与运算
摘要:PS:本文转自http://www.blogjava.net/orangelizq/archive/2008/07/20/216228.html在剖析该问题前请看如下代码public static String bytes2HexString(byte[] b) {String ret = "";for (int i = 0; i b.length; i++) { String hex = Integer.toHexString(b[ i ] & 0xFF); if (hex.length() == 1) { hex = '0' + hex; } ret += hex.toUpperCa 阅读全文

posted @ 2010-11-24 17:17 NanguoCoffee 阅读(831) 评论(2) 推荐(1)

JAVA 编码方式
摘要:下面解释一下Java的编码方式,知道了编码方式则乱码将很容易解决。1:java中byte是以补码表示:[转]java中byte转换int时为何与0xff进行2 : IO流操作的基本单元 观看io里面stream的操作,最终有两种:write(int b),write(byte[] bs),读的方式也一样。 其余的均是在这两种方式上进行封装处理。 由此也能看到文件操作的基本单元bit,而Java的基本单元是字节(byte),一个字节8个bit,字节能表示的范围为[0,255]。而java里面的byte类型的范围是[-128,127],这点必须区分开。 因此对write(b), write(byt 阅读全文

posted @ 2010-11-24 11:17 NanguoCoffee 阅读(4948) 评论(0) 推荐(0)

导航