汉字编码简单小结下

前面看了那么多,这里做一个小结:
编码标准
1. GB2312 ->GBK -> GB18030 , 对同一个汉字而言,其编码在这三种标准中(如果有)一致
2. Unicode(UCS-2, UCS-4) 是另外一套定义,每个汉字的编码和上面的不一样。

对于每个标准,在不同的系统上,存储的格式是不一样的。于是有对应的编码传输格式。我暂且叫做编码标准的别名:
GB2312 (EUC-CN)
GBK (CP936)
GB18030 –
Unicode (UTF-8/UTF-16/…)

在PHP中,后面括号中的编码方式是被支持的。



本文地址: http://www.bagualu.net/wordpress/archives/1830 转载请注明




发表评论

电子邮件地址不会被公开。 必填项已用*标注