|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
在W3C的HTML工作小组电子邮件论坛上频频冒出这样的情绪化批判字眼:“幼稚”、“令人无法忍受”、“荒谬”、“使诈”等。网页制造poluoluo文章简介:ANSI,Unicode,UTF-8网页编码的区分.
1、ASCII码
我们晓得,在盘算机外部,一切的信息终极都暗示为一个二进制的字符串。每个二进制位(bit)有0和1两种形态,因而八个二进制位就能够组合出256种形态,这被称为一个字节(byte)。也就是说,一个字节一共能够用来暗示256种分歧的形态,每个形态对应一个标记,就是256个标记,从0000000到11111111。
上个世纪60年月,美国制订了一套字符编码,对英语字符与二进制位之间的干系,做了一致划定。这被称为ASCII码,一向相沿至今。
ASCII码一共划定了128个字符的编码,好比空格“SPACE”是32(二进制00100000),年夜写的字母A是65(二进制01000001)。这128个标记(包含32个不克不及打印出来的把持标记),只占用了一个字节的前面7位,最后面的1位一致划定为0。
2、非ASCII编码
英语用128个标记编码就够了,可是用来暗示其他言语,128个标记是不敷的。好比,在法语中,字母上方有注音标记,它就没法用ASCII码暗示。因而,一些欧洲国度就决意,使用字节中闲置的最高位编进新的标记。好比,法语中的 |
|