菜菜博士

欢迎来到 菜菜博士 在网络的家



GB系列编码 比 UNICODE 先进,是最先进的编码


首先 UNICODE 里头只有 utf8 能兼容 ascii,所以,这已经是 UNICODE 的一大失败了。
接着我们将两个大方面的比较

一,汉字方面
1.1 汉字编码排列方面
UNICODE 编码中,汉字的排列毫无规律可言。 (0分)
GB 系列编码中,汉字都是依据读音笔画排列下来的。非常的有规律。 (1分)

1.2 编码效率方面
UNICODE 在实现上,只有 utf8是兼容 ascii的,我们只考虑 utf8
utf8汉字大部分是 3byte编码,少数汉字为 4byte (0分)
GB系列编码中,汉字几乎是 2byte编码,少数汉字为 4byte编码(GB18030标准) (1分)

二,非汉字部分
非汉字部分就是英语咯,还有欧洲语言,还有特殊字符。其中英语是一样的,不用比较
2.1 非ascii字符集支持
GB系列标准中,欧洲字母也是和汉字一样编入方案的。 (1分)
和 UNICODE 一样支持欧洲字母 (1分)
2.2 其他国家语言,包括繁体中文
GBK 中收录大部分繁体。在新的扩增标准 GB18030中,呵呵,保留了足够的码位来支持全世界的字符。 (1分)
UNICODE 一样 (1分)
2.3 非汉字编码效率
UNICODE 反而对很少用到的字符给比较小的码位,在 UTF8中表现为2byte ....  (0分)
GB系列编码中,汉字为2byte,常用的他国语言文字也是2byte,其他少用字符的由 GB18030扩展,为 4byte (1分)

综合起来,UNICODE 就是一垃圾编码,给这个世界带来了混乱,早该废止!!
4 条评论
# 1: November 25, 2010, 12:51 pm, alick said:

可惜GB没能向外推广
# 2: November 27, 2010, 11:42 pm, microcai said:

是啊 .....
# 3: December 11, 2010, 10:47 pm, jarryson said:

unicode优先考虑拉丁文,GB考虑中文比较多,人家unicode管你中文日文韩文干吗。。

GB18130在local-gen的时候非常非常慢。gb*在编码顺序上笔画什么的没什么意义,用户不可能接触到.
# 4: December 11, 2010, 11:11 pm, jarryson said:

找了一下,unicode一般说的是utf-16,全部2byte存储,这和gb*一样,英文部分也是2byte,这比utf8浪费很多空间,这在拉丁文国家怎么会被选用呢。

而且gb字库的排列仅仅对于中国有用,对日文韩文呢,他们不会以读音来排列,这种排列对他们没用也不会采用

总的来说utf8兼容性是最佳的了,utf16国际化也是相当好
添加评论

昵称 *

E-mail