后来机器间需要相互通信的时候,发现在不同计算机上显示出来的字符不一样,在IBM上“00010100”数字代表“A”,跑到微软系统上显示成了“B”,大家就傻眼了。于是美国的标准化组织就跑出来制定了ASCII编码(American Standard Code for Information Interchange),统一了游戏规则,规定了常用符号用哪些二进制数来表示。
UTF-n编码(Unicode Transformation Format Unicode字符集转换格式,n表示码元位数)是Unicode这套编码体系里的编码实现CES部分,像UTF-8、UTF-16、UTF-32都是将数字转换到实际的二进制编码实现,Unicode的编码实现除了UTF系列之外,还有UCS-2/4,GB18030等。但是现在很多人误把Unicode当成只是一个字符编号,这其实是不对的。
说起Unicode我们不得不提UCS(全称Universal Multiple-Octet Coded Character Set 通用多八位编码字符集),国际标准编号ISO/IEC 10646,是由 ISO 和 IEC 两家国际标准组织联合成立的工作组设计的一套新的统一字符集项目,目的与Unicode 联盟一样致力于开发一款全世界通用的编码集。