python html5 bootstrap 视频教程

德云社区

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 14030|回复: 0

gb18030-2005 - 含少数民族文字 70000个汉字的中文字符编码集

[复制链接]

172

主题

258

帖子

1114

积分

版主

Rank: 7Rank: 7Rank: 7

金钱
663
金币
7
威望
0
贡献
0
发表于 2015-8-21 00:21:12 | 显示全部楼层 |阅读模式
AI人工智能 语音助理 人工翻译 教程
gb18030-2005 - 含少数民族文字 70000个汉字的中文字符编码集

GB18030有两个版本:GB18030-2000和GB18030-2005。


GB18030-2005与GB18030-2000的编码体系结构是完全相同的。


人工机器 GUI文档 智能批处理式 "数字翻译" 工具 (集成HTML源码排版 常用字符集转码)

http://dt.digitser.cn/zh-CN/app/translate/index.html


GB18030-2000是GBK的取代版本,是在GBK基础上增加了CJK统一汉字扩充A汉字

2000年发布的GB18030-2000,全名是《信息技术汉字编码字符集基本集的扩充》。GB18030-2000仅规定了常用非汉字符号和27533个汉字(包括部首、部件等)的编码。


GB18030-2000是全文强制性标准,市场上销售的产品必须符合。


国家标准GB18030-2000《信息交换用汉字编码字符集基本集的补充》是我国继GB2312-1980和GB13000-1993之后最重要的汉字编码标准,是我国计算机系统必须遵循的基础性标准之一。


GB18030-2000编码标准是由信息产业部和国家质量技术监督局在2000年3月17日联合发布的,并且将作为一项国家标准在2001年的1月正式强制执行。


GB18030-2005是在GB18030-2000基础上增加了CJK统一汉字扩充B汉字

GB18030-2005《信息技术中文编码字符集》是我国自主研制的以汉字为主,并包含多种我国少数民族文字(譬如:藏、蒙古、傣、彝、朝鲜、维吾尔文、等)的超大型中文编码字符集强制性标准,收入汉字70000余个


2005年发布的GB18030-2005,是在GB18030-2000的基础上增加了42711个汉字和多种我国少数民族文字的编码,增加的这些内容是推荐性的。


故GB18030-2005为部分强制性标准,自发布之日起代替GB18030-2000。


GB18030-2005的单字节编码部分、双字节编码部分和四字节编码部分的CJK统一汉字扩充A(即:0x8139EE39 — 0x82358738)部分为强制性。


01、在四字节字符表中增加CJK统一汉字扩充B和已在GB13000中编码的我国少数民族文字字符的字形。


其实GB18030-2000已经映射了这些码位,但GB18030-2000没有给出这些字符的字形。


02、调整字符?编码。


03、去掉了单字节编码的欧元符号(0x80)。


(声明:其实GBK和GB18030-2000都没有单字节编码的欧元符号,微软的CP936才有这个符号并定义在0x80)



扫一扫关注 德云社区 微信公众号

版权声明:
本文为独家原创稿件,版权归 德云社区,未经许可不得转载。
AI人工智能 语音助理 人工翻译 教程
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|Sitemap|小黑屋|德云社区 |网站地图  

GMT+8, 2024-11-23 07:16 , Processed in 0.025840 second(s), 28 queries .

工业和信息化部: 粤ICP备14079481号-2

技术支持 乐数软件     版权所有 © 2014-2021 德云社区    

快速回复 返回顶部 返回列表