字符,字节,字母,汉字

区别和联系

Posted by 张振 on May 10, 2019

字符, 字母, 汉字的定义

维基百科中解释: 在计算机和电信领域中,字符(Character)是一个信息单位。对使用字母系统或音节文字等自然语言,它大约对应为一个音位、类音位的单位或符号。简单来讲就是一个汉字、假名、韩文字……,或是一个英文、其他西方语言的字母。字符的例子有:字母、数字系统或标点符号。

所以字符是指,一个汉字或者一个字母一个句号都称之为一个字符.

字节

字节(Byte),字节(Byte)是一种计量单位,表示数据量多少,它是计算机信息技术用于计量存储容量的一种计量单位。 一个字节代表八个比特(Bit),今日标准以8比特作为一字节,因8为二进制整数。

所以根据编码的不同,一个字符也占用不同的字节数:

  • ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。 一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值0,最大值255。
  • UTF-8编码中,一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。
  • Unicode编码中,一个英文等于两个字节,一个中文(含繁体)等于两个字节。 符号:英文标点占一个字节,中文标点占两个字节。举例:英文句号”.”占1个字节的大小,中文句号”。”占2个字节的大小。
  • UTF-16编码中,一个英文字母字符或一个汉字字符存储都需要2个字节(Unicode扩展区的一些汉字存储需要4个字节)。
  • UTF-32编码中,世界上任何字符的存储都需要4个字节。