Unicode 和 ISO 10646
ISO 和 Unicode 组织在大约80年代末,各自独立的推出了各语言的全球统一编码标准,但是在推出不久,他 …
ISO 和 Unicode 组织在大约80年代末,各自独立的推出了各语言的全球统一编码标准,但是在推出不久,他 …
mb_list_encodings()的输出,我的php版本是 PHP 5.3.2-1 Array ( [0] …
GB2312-1980 是中国1981年公布的,包含7,445个字符,其中6,763个汉字和682个非汉字字符 …
在处理中文的过程中,中文编码是一件很头疼的事情,经常会出现这样那样的问题。这里有一个通用的解决方案。 1. 确 …
一直想收集一些网络上的小说文章,可以让自己很方便的查询。或者另外一个很有说服力的理由就是,有这些东西,可以以自 …
http://code.google.com/p/pymmseg/ 有download , 有字典, 可运行 …