欧宝app下载-客户端

当前位置:欧宝app下载-客户端 > 校车 >
常见编码格式
作者:87 发布日期:2021-06-05

中文编码主要有以下四栽: GB2312:简体中文编码,一个汉字占用2字节,在大陆是主要编码手段。当文章/网页中包含繁体中文、日文、韩文等等时,这些内容能够无法被切确编码。 BIG5:繁体中文编码。主要在台湾地区采用。 GBK:声援简体及繁体中文,但对异国非拉丁字母说话照样有题目。 UTF-8:Unicode编码的一栽。Unicode用一些基本的保留字符制定了三套编码手段,它们别离UTF-8,UTF-16和UTF-32。在UTF-8中,字符所以8位序列来编码的,用一个或几个字节来外示一个字符。这栽手段的最大益处,是UTF-8保留了ASCII字符的编码做为它的一片面。UTF-8俗称“万国码”,能够同屏表现众语栽,一个汉字占用3字节。为了做到国际化,网页答尽能够采用UTF-8编码。

自然,处理中文时http头也要改成UTF-8编码的-----添上<meta http-equiv="Content-Type" content="text/html; charset=utf-8">。 字符集 常用字符集分类 ASCII及其扩展字符集 作用:外语英语及西欧说话。 位数:ASCII是用7位外示的,能外示128个字符;其扩展行使8位外示,外示256个字符。 周围:ASCII从00到7F,扩展从00到FF。 ISO-8859-1字符集 作用:扩展ASCII,外示西欧、希腊语等。 位数:8位, 周围:从00到FF,兼容ASCII字符集。 GB2312字符集 作用:国家简体中文字符集,兼容ASCII。 位数:行使2个字节外示,能外示7445个符号,包括6763个汉字,几乎遮盖一切高频率汉字。 周围:高字节从A1到F7, 矮字节从A1到FE。将高字节和矮字节别离添上0XA0即可得到编码。 BIG5字符集 作用:同一繁体字编码。 位数:行使2个字节外示,外示13053个汉字。 周围:高字节从A1到F9,矮字节从40到7E,A1到FE。 GBK字符集 作用:它是GB2312的扩展,添入对繁体字的声援,兼容GB2312。 位数:行使2个字节外示,可外示21886个字符。 周围:高字节从81到FE,矮字节从40到FE。 GB18030字符集 作用:它解决了中文、日文、朝鲜语等的编码,兼容GBK。 位数:它采用变字节外示(1 ASCII,2,4字节)。可外示27484个文字。 周围:1字节从00到7F; 2字节高字节从81到FE,矮字节从40到7E和80到FE;4字节第一三字节从81到FE,第二四字节从30到39。 UCS字符集 作用:国际标准 ISO 10646 定义了通用字符集 (Universal Character Set)。它是与UNICODE同类的机关,UCS-2和UNICODE兼容。 位数:它有UCS-2和UCS-4两栽格式,别离是2字节和4字节。 周围:现在,UCS-4只是在UCS-2前线添了0x0000。 UNICODE字符集 作用:为世界650栽说话进走同一编码,兼容ISO-8859-1。 位数:UNICODE字符集有众个编码手段,别离是UTF-8,UTF-16和UTF-32。

 

按所外示的文字分类

说话                             字符集                                正式名称

英语、西欧语                ASCII,ISO-8859-1        MBCS 众字节

简体中文                      GB2312                          MBCS 众字节

繁体中文                      BIG5                               MBCS 众字节

简繁中文                      GBK                                MBCS 众字节

中文、日文及朝鲜语       GB18030                        MBCS 众字节

各国说话                      UNICODE,UCS              DBCS 宽字节



Powered by 欧宝app下载-客户端 @2018 RSS地图 HTML地图

Copyright 365站群 © 2013-2021 365建站器 版权所有