区位码国标码机内码的转换?

2020-07-09 科技 125阅读

1、区位码

将汉字用区号01~94和位号01~94来表示汉字的编码,是一个4位十进制数,前两位表示区号,后两位表示位号,每一行称为一个“区”,编号为01-94,每一列称为一个“位”,编号为01-94,这种用来表示每个字符所处位置的图称为“区位图”。

用字符所在区位图中的位置来表示字符的代码称为“区位码”。比如“啊”的区位码为1601。

2、国标码

对这些编号进行编码的结果就得到“国家标准代码”,简称为“国标码”,也称“汉字交换码” 
国标码由两个字节组成,其高字节和低字节的最高位都为0,与7位标准ASCII码类似。

编码方法是现将十进制表示的区码和位码转换为十六进制表示的区码和位码,再讲这个代码的高字节(第一个字节)和低字节(第二个字节)分别加上20H(100000B),就得到国标码。每个字节加20H的原因是为了避开ASCII码表的32个控制字符。

如“啊”的区位码为1601,计算“啊”的国标码,首先将“啊”的区码和位码分别加32,得区码16+32=48=30H,位码01+32=33=21H,所以“啊”的国标码为3021H。

3、机内码

为了解决ASCII码和国标码在同事使用时产生二义性,讲国标码的高字节和低字节的最高位b7都变成1,或者说每个字节都加上0x80,这样得到的代码被称为机内码,常被简写成“内码”。

已知“啊”的国标码为3021H,得知二进制编码:(0011000)(00100001),将每个字节最高位分别置1,得(10110000)(10100001)为二进制机内码,转换成十六进制为B0A1H(机内码)。

机内码=国标码+8080H

扩展资料:

汉语拼音推广应用,并逐步过渡到汉字和汉语拼音文字并存并用,这是一种双轨制。汉字信息处理领域中,音码和形码的并存并用,同样是一种双轨制。因此,不少人认为,采用双轨制好,理由有以下5点:

对掌握普通话的人来说,使用音码比形码方便,速度比较快。形码虽然较慢,但能输入任何汉字(包括古字)。采用双轨,操作员认识的字可按音输入,不认识的字按形输入,会普通话的人可按音输入,方音重的人可按形输入。

对于用字量少的单位,按音输入无问题,但对用字量多的单位来说,按音输入就不如按形输入,因为一般人只能念出一部分汉字。

按形输入(尤其是整体输入)对于中文信息处理的某类工作,如统计汉字,非常适合;但是对于其他类工作,例如统计汉语的音(声韵调)则无能为力。按音输入则正相反。双轨正好是相辅相成。

有的形码可以照顾多种汉字(如日本的汉字、南朝鲜的汉字),而音码能分词连写,便于作进一步的信息处理。

适当的双轨方案,不会增加设备上的麻烦。如不考虑采用整字输入,一般均可使用现有的小键盘。

参考资料来源:百度百科——汉字编码

声明:你问我答网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系fangmu6661024@163.com