【编码】几种常用编码的加解码

参考资料

https://blog.csdn.net/u011127019/article/details/99629697
(1)C# 的所有源代码文件，默认编码为 UTF-8，注意，是源代码文件，而不是 C# 中的 string。
(2)C# 中的所有 string，默认编码均为 Unicode (UTF-16)。
(3)C# 产生的 ASP.NET 源代码，如 ASPX/CS，在浏览器响应回去客户端之后，编码默认为 UTF-8。可以通过 ContentType 请求头信息更改默认编码。比如：ContentType: application/json, charset=utf-8。
(4)C# 中可以用 System.Text.Encoding.ASCII 提供的相关方法，把默认 Unicode 编码的字符串转换为 ASCII。详细请参考 GetString，GetBytes，GetByteCount 等方法。
测试过程代码
       public static string TestCoder()
       {
           string msg = "测试ceshi";//7个字符
           StringBuilder sbContent = new StringBuilder();

           Dictionary<int, byte[]> pairs = new Dictionary<int, byte[]>();

           byte[] b1 = Encoding.ASCII.GetBytes(msg);
           byte[] b2 = Encoding.Default.GetBytes(msg);
           byte[] b3 = Encoding.UTF7.GetBytes(msg);
           byte[] b4 = Encoding.UTF8.GetBytes(msg);
           byte[] b5 = Encoding.Unicode.GetBytes(msg);
           byte[] b6 = Encoding.BigEndianUnicode.GetBytes(msg);
           byte[] b7 = Encoding.UTF32.GetBytes(msg);

           pairs.Add(pairs.Count, b1);
           pairs.Add(pairs.Count, b2);
           pairs.Add(pairs.Count, b3);
           pairs.Add(pairs.Count, b4);
           pairs.Add(pairs.Count, b5);
           pairs.Add(pairs.Count, b6);
           pairs.Add(pairs.Count, b7);

           foreach (KeyValuePair<int, byte[]> item in pairs)
           {
               sbContent.AppendLine("");
               string s1 = Encoding.ASCII.GetString(item.Value);
               string s2 = Encoding.Default.GetString(item.Value);
               string s3 = Encoding.UTF7.GetString(item.Value);
               string s4 = Encoding.UTF8.GetString(item.Value);
               string s5 = Encoding.Unicode.GetString(item.Value);
               string s6 = Encoding.BigEndianUnicode.GetString(item.Value);
               string s7 = Encoding.UTF32.GetString(item.Value);

               int coder = item.Key;
               string codeName = "";
               switch (coder)
               {
                   case 0: codeName = "ASCII"; break;
                   case 1: codeName = "Default"; break;
                   case 2: codeName = "UTF7"; break;
                   case 3: codeName = "UTF8"; break;
                   case 4: codeName = "Unicode"; break;
                   case 5: codeName = "BigEndianUnicode"; break;
                   case 6: codeName = "UTF32"; break;
                   default:
                       break;
               }
               sbContent.AppendLine($"{coder}、编码方式：{codeName}".Replace("\0", ""));
               sbContent.AppendLine($"{coder}.1、解码结果-ASCII：{s1}".Replace("\0", ""));
               sbContent.AppendLine($"{coder}.2、解码结果-Default：{s2}".Replace("\0", ""));
               sbContent.AppendLine($"{coder}.3、解码结果-UTF7：{s3}".Replace("\0", ""));
               sbContent.AppendLine($"{coder}.4、解码结果-UTF8：{s4}".Replace("\0", ""));
               sbContent.AppendLine($"{coder}.5、解码结果-Unicode：{s5}".Replace("\0", ""));
               sbContent.AppendLine($"{coder}.6、解码结果-BigEndianUnicode：{s6}".Replace("\0", ""));
               sbContent.AppendLine($"{coder}.7、解码结果-UTF32：{s7}".Replace("\0", ""));
           }

           return sbContent.ToString();
       }
结果由于解码后会有\0，而C#遇到\0会终止字符串，所以下面的文字结果可能不准确，直接返回结果参见截图
ASCII
1、解码结果-ASCII：??ceshi
2、解码结果-Default：??ceshi
3、解码结果-UTF7：??ceshi
4、解码结果-UTF8：??ceshi
5、解码结果-Unicode：㼿散桳�
6、解码结果-BigEndianUnicode：㼿捥獨�
7、解码结果-UTF32：��
Default
1、解码结果-ASCII：????ceshi
2、解码结果-Default：测试ceshi
3、解码结果-UTF7：²âÊÔceshi
4、解码结果-UTF8：����ceshi
5、解码结果-Unicode：퓊散桳�
6、解码结果-BigEndianUnicode：닢쫔捥獨�
7、解码结果-UTF32：���
 2.UTF7
1、解码结果-ASCII：+bUuL1Q-ceshi
2、解码结果-Default：+bUuL1Q-ceshi
3、解码结果-UTF7：测试ceshi
4、解码结果-UTF8：+bUuL1Q-ceshi
5、解码结果-Unicode：戫畕ㅌⵑ散桳�
6、解码结果-BigEndianUnicode：⭢啵䰱儭捥獨�
7、解码结果-UTF32：����
UTF8
1、解码结果-ASCII：??????ceshi
2、解码结果-Default：娴嬭瘯ceshi
3、解码结果-UTF7：æµè¯ceshi
4、解码结果-UTF8：测试ceshi
5、解码结果-Unicode：뗦閯散桳�
6、解码结果-BigEndianUnicode：诨꾕捥獨�
7、解码结果-UTF32：���
Unicode
1、解码结果-ASCII：Km??ceshi
2、解码结果-Default：Km諎ceshi
3、解码结果-UTF7：KmÕceshi
4、解码结果-UTF8：KmՋceshi
5、解码结果-Unicode：测试ceshi
6、解码结果-BigEndianUnicode：䭭햋挀攀猀栀椀
7、解码结果-UTF32：����
BigEndianUnicode
1、解码结果-ASCII：mK??ceshi
2、解码结果-Default：mK嬚ceshi
3、解码结果-UTF7：mKÕceshi
4、解码结果-UTF8：mK��ceshi
5、解码结果-Unicode：䭭햋挀攀猀栀椀
6、解码结果-BigEndianUnicode：测试ceshi
7、解码结果-UTF32：����
 6.UTF32
1、解码结果-ASCII：Km??ceshi
2、解码结果-Default：Km諎ceshi
3、解码结果-UTF7：KmÕceshi
4、解码结果-UTF8：KmՋceshi
5、解码结果-Unicode：测试ceshi
6、解码结果-BigEndianUnicode：䭭햋挀攀猀栀椀
7、解码结果-UTF32：测试ceshi
总结7种编码方式，
只有ASCII无法编码后正确还原原字符串，因为ASCII本身就没有编入汉字
其他6种都可以正确还原原字符串
posted @ 2021-07-30 16:16 我有我奥妙阅读(494) 评论(0) 收藏举报
刷新页面返回顶部
我有我奥妙

【编码】几种常用编码的加解码

参考资料

测试过程

代码

结果

总结

公告