您的位置:首页 > 游戏 > 手游 > 2021给个最新网站_深圳定制礼品杯_网站软文代写_品牌宣传活动策划方案

2021给个最新网站_深圳定制礼品杯_网站软文代写_品牌宣传活动策划方案

2025/4/7 18:59:15 来源:https://blog.csdn.net/muzibuku/article/details/143103954  浏览:    关键词:2021给个最新网站_深圳定制礼品杯_网站软文代写_品牌宣传活动策划方案
2021给个最新网站_深圳定制礼品杯_网站软文代写_品牌宣传活动策划方案

文章目录

  • 前言
  • 一、二进制编码:BCD码
  • 二、字符编码的先行者:ASCII
  • 三、本地化编码(ANSI)
  • 四、Unicode的国际化


前言

在计算机的发展过程中字符编码的发展是一个非常有趣的过程,字符编码发展历史的意义深远,它不仅影响了计算机技术的演进,还极大地促进了全球信息的交流与共享。


一、二进制编码:BCD码

BCD码(Binary-Coded Decimal),即二进制编码十进制数,是一种数字编码方式。在计算机发展的早期的时候计算机就真的就是用来计算的,它将4个二进制转为十进制0~9这10个数码但是现在也在使用这种编码技巧,最常用于会计系统的设计里,因为会计制度经常需要对很长的数字串作准确的计算。相对于一般的浮点式记数法,采用BCD码,既可保存数值的精确度,又可免去使计算机作浮点运算时所耗费的时间。此外,对于其他需要高精确度的计算,BCD编码亦很常用。(这个编码出现比计算机还早,最早是用在打孔卡上的)

二、字符编码的先行者:ASCII

ascll码是字符编码的先行者它是由美国的发布的,在百度百科中是这样形容ascll的
:==ASCII (American Standard Code for Information Interchange):美国信息交换标准代码是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准,并等同于国际标准 ISO/IEC 646。ASCII第一次以规范标准的类型发表是在1967年,最后一次更新则是在1986年,到目前为止共定义了128个字符 ==
ascll直到现在也依旧在广泛使用,例如如c语言就大量使用, 而它产生缘由是:在计算机中,所有的数据在存储和运算时都要使用二进制数表示(因为计算机用高电平和低电平分别表示1和0)。

例如:像a、b、c、d这样的52个字母(包括大写)以及0、1等数字还有一些常用的符号(例如*、#、@等)在计算机中存储时也要使用二进制数来表示,而具体用哪些二进制数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码),而大家如果要想互相通信而不造成混乱,那么大家就必须使用相同的编码规则,于是美国有关的标准化组织就出台了ASCII编码,统一规定了上述常用符号用哪些二进制数来表示 。

美国信息交换标准代码是由美国国家标准学会(American National Standard Institute , ANSI )制定的,是一种标准的单字节字符编码方案,用于基于文本的数据。它最初是美国国家标准,供不同计算机在相互通信时用作共同遵守的西文字符编码标准,后来它被国际标准化组织(International Organization for Standardization, ISO)定为国际标准,称为ISO 646标准。适用于所有拉丁文字字母。(因为要表示这是美国编写的所以加入了美元符号($))
在这里插入图片描述
这个就是一张ascll码的二维图,其中ASCII共定义了128个字符,包括95个可显示字符(如阿拉伯数字、小写英文字母、大写英文字母、常用的英文标点符号等)和33个控制字符(如回车、退格、换行等特殊的控制功能)。每个字符都有一个对应的数字,叫做码点,ASCII字符的码点为0到127之间的数字。
但是这个无法满足国际的使用于是各国发展了自己的本地字符编码

三、本地化编码(ANSI)

随着计算机技术的普及,越来越多的国家和地区开始使用计算机。然而,ASCII编码只能表示英文字符,无法满足其他语言的需求。

为了解决这个问题,各国开始制定自己的字符编码标准,如欧洲的ISO/IEC 8859系列字符编码、中国的GB系列字符编码等。

但是如何知晓这是那个国家的编码呢这就要计算机中一套定义用户的语言、国家和用于定义用户希望在其用户界面上看到的各种可以改变的选择的参数集合做出一个标识符。通常一个locale标识符至少包括一个语言标识符和一个区域标识符。(比如金钱符号)

虽然本地化编码的多样性带来了便利但是字符在不同语言环境下可能显示不同字符或乱码的问题。为了解决这一问题,国际标准化组织和统一码联盟等机构制定了Unicode编码标准。Unicode编码是一种国际化编码,它可以表示所有语言的字符,并且具有定长和不定长两种形式(如UTF-8、UTF-16等),从而解决了本地化编码的兼容性问题。

四、Unicode的国际化

1987年,Unicode联盟(Unicode Consortium)成立,该联盟是一个非盈利组织,致力于开发、维护和推广软件国际化的标准和数据,尤其是Unicode标准。

Unicode的第一份草案发布于1988年,此后项目继续进行,工作组也随之扩张。

1991年1月3日,Unicode 1.0的第一卷发布,该版本包含了约7600个字符。第二卷则在1992年6月发布。

常见的有UTF-8、UTF-16、UTF-32等。这些编码方式定义了如何将Unicode码点映射到字节序列。

UTF-8:是一种变长编码方案,使用1到4个字节来表示一个Unicode字符。UTF-8编码具有兼容ASCII码的优点,并且对于英文等常用字符使用较少的字节数,从而节省了存储空间。

UTF-16:是一种定长编码方案(但存在代理对机制以处理超出基本多文种平面BMP的字符),通常用于在字处理器、文本编辑器和Windows操作系统中表示Unicode字符。UTF-16编码对于大多数常用字符使用2个字节,但对于一些特殊字符可能需要使用4个字节(通过代理对机制实现)。

UTF-32:也是一种定长编码方案,使用4个字节来表示一个Unicode字符。UTF-32编码具有简单直观的优点,但相对于UTF-8和UTF-16来说,它占用的存储空间较大。

在日常的编码过程中我们常用UTF-8(如Java它一开始就将char定义为2bit位)

目前,Unicode已经成为字符编码的主流标准,广泛应用于各种国际化的应用场景中。随着计算机技术的不断发展和全球化进程的加速推进,Unicode编码将继续发挥其重要作用,促进信息交流和共享。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com