计算机中汉字是如何存储的?
新闻资讯
2023-07-12 12:04
50
0
Unicode是一种国际标准字符集,它为世界上所有的字符都分配了一个唯一的数字编码,包括汉字、拉丁字母、希腊字母、日文假名等。Unicode编码可以使用不同的编码方式进行存储,如UTF-8、UTF-16等。在计算机中,汉字通常使用UTF-8编码进行存储。Unicode编码是一种字符编码方案,用于将字符集中的每个字符映射到一个唯一的数字值。它包含了世界上几乎所有的字符,包括各种语言的字母、数字、标点符号、符号、表情符号等。Unicode编码的目的,是为了解决不同国家和地区使用不同字符集的问题,使得不同的计算机系统和软件能够正确地显示和处理各种语言的文本。Unicode编码通常使用16位或32位的数字表示一个字符,其中16位的编码称为UTF-16,32位的编码称为UTF-32。Unicode编码的历史可以追溯到20世纪80年代初期,当时计算机系统的字符编码方式非常混乱,不同的计算机系统使用不同的编码方式,导致在不同系统之间传输和处理文本数据时出现了很多问题。为解决这个问题,国际标准化组织(ISO)于1987年成立了一个委员会,负责制定一个全球通用的字符编码标准。这个委员会最终制定了ISO 10646标准,该标准定义了一个包含所有世界上已知字符的编码表。然而,由于ISO 10646标准的实现成本较高,且与已有的字符编码标准存在冲突,因此在1991年Unicode联盟成立,旨在开发一个与ISO 10646兼容的字符编码标准。Unicode联盟最终制定了Unicode编码标准,该标准定义了一个包含所有世界上已知字符的编码表,并且与ISO 10646标准兼容。Unicode编码标准的发布和广泛应用,使得不同计算机系统之间的文本数据传输和处理变得更加简单和可靠。目前,Unicode编码已成为全球通用的字符编码标准,被广泛应用于计算机系统、互联网和移动设备等领域。早年的计算机系统比较朴素,能够正常显示就够了,没有那么多花哨的字体。那时候的字体主要是“点阵字”,就是逐像素保存的字体。点阵字,逐像素画出字体点阵字的主要缺点是不能随意放大缩小,字体死板、有锯齿。现在点阵字还应用于家电、广告牌、公交车报站屏幕等地方,但大部分有电脑手机的地方都不再使用点阵字技术了。现在广泛使用的TrueType、OpenType等新一代字体技术,能够以矢量方式存储字体,占用空间小、渲染快、显示效果清晰锐利。各种字体应用范围也很广,所以字体的制作、授权和使用也是一个很大的产业链。由于中文常用字非常多,导致中文字体的制作成本非常高,相比英文字库购买费用、授权费用也很高。我们在工作中千万要注意字体授权,不要在商业产品中随意选用字体,务必注意版权问题。例如,Windows系统自带的“雅黑”字体就不能任意使用。
文章引用微信公众号"嵌入式微处理器",如有侵权,请联系管理员删除!