liangsheng 发表于 2015-8-21 00:21:12

gb18030-2005 - 含少数民族文字 70000个汉字的中文字符编码集

gb18030-2005 - 含少数民族文字 70000个汉字的中文字符编码集
GB18030有两个版本:GB18030-2000和GB18030-2005。
GB18030-2005与GB18030-2000的编码体系结构是完全相同的。
人工机器 GUI文档 智能批处理式 "数字翻译" 工具 (集成HTML源码排版 常用字符集转码)http://dt.digitser.cn/zh-CN/app/translate/index.html
GB18030-2000是GBK的取代版本,是在GBK基础上增加了CJK统一汉字扩充A汉字

2000年发布的GB18030-2000,全名是《信息技术汉字编码字符集基本集的扩充》。GB18030-2000仅规定了常用非汉字符号和27533个汉字(包括部首、部件等)的编码。
GB18030-2000是全文强制性标准,市场上销售的产品必须符合。
国家标准GB18030-2000《信息交换用汉字编码字符集基本集的补充》是我国继GB2312-1980和GB13000-1993之后最重要的汉字编码标准,是我国计算机系统必须遵循的基础性标准之一。
GB18030-2000编码标准是由信息产业部和国家质量技术监督局在2000年3月17日联合发布的,并且将作为一项国家标准在2001年的1月正式强制执行。
GB18030-2005是在GB18030-2000基础上增加了CJK统一汉字扩充B汉字

GB18030-2005《信息技术中文编码字符集》是我国自主研制的以汉字为主,并包含多种我国少数民族文字(譬如:藏、蒙古、傣、彝、朝鲜、维吾尔文、等)的超大型中文编码字符集强制性标准,收入汉字70000余个。
2005年发布的GB18030-2005,是在GB18030-2000的基础上增加了42711个汉字和多种我国少数民族文字的编码,增加的这些内容是推荐性的。
故GB18030-2005为部分强制性标准,自发布之日起代替GB18030-2000。
GB18030-2005的单字节编码部分、双字节编码部分和四字节编码部分的CJK统一汉字扩充A(即:0x8139EE39 — 0x82358738)部分为强制性。

01、在四字节字符表中增加CJK统一汉字扩充B和已在GB13000中编码的我国少数民族文字字符的字形。
其实GB18030-2000已经映射了这些码位,但GB18030-2000没有给出这些字符的字形。
02、调整字符?编码。
03、去掉了单字节编码的欧元符号(0x80)。
(声明:其实GBK和GB18030-2000都没有单字节编码的欧元符号,微软的CP936才有这个符号并定义在0x80)


http://forum.digitser.cn/data/attachment/forum/201605/19/132155fevczeyds5e5y1wy.jpg
扫一扫关注 德云社区 微信公众号
版权声明:
本文为独家原创稿件,版权归 德云社区,未经许可不得转载。
页: [1]
查看完整版本: gb18030-2005 - 含少数民族文字 70000个汉字的中文字符编码集