嗯。。
是字符集(CharSet)的名称,也叫做“字符编码”CharacterEncoding..
就是指把自然语言符号在计算机中采用数字表示的编号方法。
Unicode是目前最完整的编码方式,基本上可知的字符都包括了。通常采用UTF-16编码方式,就是双字节定长编码方案。
UTF-8是Unicode的不定长编码方案,英文(ACSII)是一个字节,其他语言三个字节。
GB2312是国标阿,表示简体中文的,编码空间较少,字数也很少。
GBK是国标扩展码,编码空间扩大,基本上装进去康熙字典了。
所谓中文乱码问题,是指操作系统默认字符集或程序输入字符集和程序默认处理字符集不一致的问题。当然要在清楚双方字符集才能正确处理。