字符和字节
ASCII码:一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值0,最大值255。如一个ASCII码就是一个字节。
UTF-8编码:一个英文
字符等于一个字节,一个中文(含繁体)等于三个字节。
Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节。
符号:英文
标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“。”占2个字节的大小。
不同数量级间
数据存储是以10进制表示,数据传输是以2进制表示的,所以1KB不等于1000B
1KB=1024B=1024;1MB=1024KB=1024×1024B。其中1024=210。
1B(byte,字节)= 8 bit(见下文)
1KB(Kibibyte,
千字节)=1024B= 2^10 B;
1
MB(Mebibyte,
兆字节,百万字节,简称“兆”)=1024KB= 2^20 B;
1
GB(Gigabyte,
吉字节,十亿字节,又称“千兆”)=1024MB= 2^30 B;
1
TB(Terabyte,万亿字节,
太字节)=1024GB= 2^40 B;
1
PB(Petabyte,千万亿字节,
拍字节)=1024TB= 2^50 B;
任何数据类型的
数组都需要 20 个
字节的内存空间,加上每一数组维数占 4 个字节,再加上数据本身所占用的空间。数据所占用的内存空间可以用
数据元数目乘上每个元素的大小加以计算。例如,以 4 个 2
字节之 Integer 数据元所组成的一维
数组中的数据,占 8 个字节。这 8 个
字节加上额外的 24 个字节,使得这个
数组所需总内存空间为 32 个字节。
相关单位
B与bit
数据存储是以“字节”(Byte)为单位,数据传输是以大多是以“位”(bit,又名“比特”)为单位,一个位就代表一个0或1(即二进制),每8个位(bit,简写为b)组成一个字节(Byte,简写为B),是最小一级的信息单位。
未完待续