|
|
|
庞大而杂乱的文字内码系统
|
| |
我虽然一直搞电脑,而且研究汉字处理,但对本文主题——文字内码,仍未能通晓。但觉得当前大字库内码系统,大而乱,应该研究采用尽可能小的小字库,让电脑键盘像普通笔一样,能自由写任何文字。我是在学习有关资料的基础上写这篇文章的,以我的理解,力求写得浅近,也可供入门者阅读。我的理解,尤其是我作的推论,如果有错误,请高手来信指正。地址:chancezoo@126.com 一、代码页:字库加编码 与拍电报要把文字转变为电报码一样,电脑处理文字,也要先转变为电脑能识别的信息交换码。电脑只能分辨用电压高低表示的0和1,所以毎一个文字的代码都是特定的二进制数。电脑的存贮是以8个二进制位为单位,叫做字节,通常表示为二个各由4个二进制位组成的十六进制字符(012……9ab……f),从最小值00到最大值ff(8个二进制位均为1,等于十进制255),只有256种不同的值,只能表示ascii(美国信息交换标准代码)字符。实际上可显示的ascii字符不到100个,开头32个是不能显示的控制码,如07为嘟一声,0a为换行,0d为回车,1b为键盘左上角的逃脱键。从空格20开始才是真正的ascii字符,如30…39是十个数字0…9,41…5a是a…z,61…7a是a…z。从20到7f的96个代码,每个都有一组数据,用来显示它所代表的字形。这些数据组成一个ascii字库,只不过不如汉字字库那么大。可见,电脑一开始就用“字库加编码”的方法来处理文字的。我以前说,汉字植根于电脑的方法,一开始就错用了“字库加编码”的方法,这个说法不大确切,应该说是错用了大字库的方法。
|
|
|
|
|
|
|
|
|
| 广告载入中... |
| 广告载入中... |
| 广告载入中... |
|
|
|
|
|