字符的编码问题我不是很清楚,但是在使用电脑的时候经常遇到因为编码问题造成的困惑,这个问题一般只存在于汉字内容的网页,英语不存在这样的问题,可能是因为英语是电脑世界里的通用语吧。以前我没怎么发现编码造成的混乱,因为我所访问的网络主要以国内的为主,而且现在的浏览器做的也比较智能,可以自动选择编码。但是在访问国外的一些汉语网站的时候就特别容易出问题,一般情况下,会看到文字变成了乱码,完全不知道那是什么内容,要手动更改编码才可以解决问题,但是这样太麻烦了,而且当你再次访问国内网站的时候,还需要再把编码改回来,否则看到的还是乱码。
国内的网站一般都采用GB2312这种汉字编码,香港台湾等使用繁体汉字的地区,使用Big5编码,我觉得这两种编码之间造成的混乱比较少,还有一种编码叫做UTF-8,它的通用性比较好,所以国外的网站在提供中文内容的时候,一般都会设置为这种编码。可是我们的中文浏览器一般都会自动设置为GB2312编码,用这种设置来访问UTF-8编码的网页,轻者会出现乱码,这种情况还好一些,因为我们很容易判断出是编码造成的。还有一种情况就是,网页打开以后是一片空白,查看其源文件,又可以看到内容,这很容易让别人以为根本就没有内容。为什么不显示呢,我查到原因还是和编码有关。但我现在不明白,为什么有的网页会造成乱码,有的则是空白。我在以前的一篇文章中提到过这种现象,也指出了是编码造成的。
前两天我在blogger上创建了一个blog,其中一篇文章就出现了这种问题,打开之后就是空白页,只有手动更改编码才可以显示出文字来。那篇文章是通过Gmail发送出去的,编码可能不是UTF-8,但是不知道为什么,发布到livespaces就可以正常显示。而且我使用同样的邮箱设置,再次发布文章到blogger,竟然不会再出现编码问题了,只有那一篇文章会有这种现象,很奇怪。
我觉得应该使用一种统一的编码,国内的网站在设计网页的时候,最好也使用通用的UTF-8编码,即使是国外的人访问也可以正常的展示出来。因为历史的原因,汉字有简体和繁体的区分,编码自然就不同了,GB2312、Big5、HZ等几种编码,这些不同的编码造成的混乱在早期尤其严重,现在还好了一些,因为一般的操作系统都会携带多种文字编码,可以供你选择以正确的显示。不过有时候还会出问题,我和大陆以外的一些使用繁体字的朋友交流的时候,经常会出现乱码,而且是不可以通过更改编码来正确显示的。
没有评论:
发表评论