人们和计算机交流是通过字符进行的,但是计算机只有0和1的概念,这样就需要对字符用0和1进行编码,国际标准化组织和Unicode联合制定统一码,并没有规定字符在计算机中存储和传输的编码。为了更好地用计算机处理这些字符,还需要规定具体的字符编码格式。在我国,常用的编码方案有UTF-8、UTF-16、UTF-32及我国的国家标准GB18030—2005等。
计算机中存储一个“0”或“1”占用1个二进制位(bit)。8个二进制位组成1字节(byte)。ASCII编码用1字节表示英文字母、数字和常见字符。在GB18030—2005中,大部分常用汉字采用2字节编码。