<rp id="igllo"><object id="igllo"><blockquote id="igllo"></blockquote></object></rp>

    <dd id="igllo"></dd>
    <dd id="igllo"><track id="igllo"></track></dd>

    <dd id="igllo"><big id="igllo"></big></dd>
  • <legend id="igllo"><table id="igllo"></table></legend>
  • <ol id="igllo"><object id="igllo"><blockquote id="igllo"></blockquote></object></ol>
      <nav id="igllo"><center id="igllo"><td id="igllo"></td></center></nav>

        重庆小潘seo博客

        当前位置:首页 > 重庆网络营销 > 小潘杂谈 >

        小潘杂谈

        gbk编码的范围是多少?

        时间:2020-08-13 03:15:13 作者:重庆seo小潘 来源:
        GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE(高字节从81到FE,低字节从40到FE),剔除xx7F码位,共23940个码位。 GBK编码共收录汉字和图形符号21886个,其中汉字(包括部首和构件)

        GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE(高字节从81到FE,低字节从40到FE),剔除xx7F码位,共23940个码位。

        GBK编码共收录汉字和图形符号21886个,其中汉字(包括部首和构件)21003个,图形符号883个。GBK编码支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。GBK编码方案于1995年12月15日正式发布,这一版的GBK规范为1.0版。

        一、码位分配及顺序

        GBK 亦采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个。

        全部编码分为三大部分:

        1、汉字区。

        包括:

        a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。

        b. GB 13000.1 扩充汉字区。包括:

         (1)、 GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。

         (2) 、GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。

         (3) 、汉字“0”安排在图形符号区GBK/5:A996。

        2、图形符号区。

        包括:

        a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。

        b. GB 13000.1 扩充非汉字区。即 GBK/5: A840-A9A0。BIG-5 非汉字符号、结构符和“0”排列在此区。计符号 166 个。

        3、 用户自定义区:

        分为(1)(2)(3)三个小区。

        (1)、 AAA1-AFFE,码位 564 个。

        (2) 、F8A1-FEFE,码位 658 个。

        (3) 、A140-A7A0,码位 672 个。

        第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。

        二、字形

        GBK 对字形作了如下的规定:

        1. 原则上与 GB 13000.1 G列(即源自中国大陆法定标准的汉字)下的字形/笔形保持一致。

        2. 在 CJK 汉字认同规则的总框架内,对所有的 GBK 编码汉字实施“无重码正形”(“GB 化”);即在不造成重码的前提下,尽量采用中国新字形。

        3. 对于超出 CJK 汉字认同规则的、或认同规则尚未明确规定的汉字,在 GBK 码位上暂安放旧字形。这样,在许多情况下 GBK 收入了同一汉字的新旧两种字形。

        4. 非汉字符号的字形,凡 GB 2312 已经包括的,与 GB 2312 保持一致;超出 GB 2312 的部分,与 GB 13000.1 保持一致。

        5. 带声调的拼音字母取半角形式。

        青青国产成人久久111网站_双指探洞疼哭了_夫妻生活片_午夜a片无码区在线观看