怎样修改eclipse的默认字符集和修改中文乱码

2022-04-01 科技 64阅读
先了解什么叫字符集。现在的操作系统和编程语言都支持Unicode,也就是说在内核层它们是记住一个字符的UnicodeCodePoint编号,它唯一地代表一个字符。但是当我们需要多字节的一个UnicodeCodePoint整数保存到磁盘上时就涉及到下面的问题:多个字节像十进制一样有高位在前,还是低位在前,我们一般生活中十进制是高位在前面,但由于历史原因有些操作系统把低位放前面,这导致了混乱,现在需要明确地制定规则来确实这点。当连续的多个字符有的是3个字节有的是4个字节表示,还有些是一个字节表示的,我们怎么知道哪几个相邻的字节是组成一个字符的?回忆一下90年代时DOS时代的汉字操作系统就解决不了这个问题,输入一个汉字然后按一下回车或删除键它在显示器上只删除字符的图形的一半,然后我们再输入一个汉字后,神奇的事情就出来了,刚输入的汉字点2个字节,但它的第1个字节和刚才删除后留下的1个字节结合起来拼出一个反正中国人看不懂的符号来。为了解决上面这些问题,我们制定了字符集编码。也就是说字符本身在内存里只是一个编号,但保存到持久性的容器中(比如磁盘,或通过网络发送给其它人)时,我们就需要按双方约定的字符集来读出或写出。那么,现在你的问题就是:中文乱码其实就是你的软件在读取时使用了这个文件当时被保存时所用的字符集不兼容的字符集。因此我们只需要明确地指定字符集即可。鼠标右击文件>OpenWith>TextEditor,以文本方式打开文件,在菜单上Edit>SetEncoding指定一个字符集,然后关闭文件,再右击文件>OpenWith,这次选择原本希望的编辑器,比如一个XML文件,就选择XMLEditor。如果你是在程序的输出窗口而不是文件中看到了乱码,那么我们只需要指定程序输出所用的字符集,比如EclipseConsole中看到乱码,我们就在你刚才的程序的LaunchingConfiguration(你启动程序时的配置)中的Common标签页中指定字符集,这个LaunchingConfiguration可以在工具栏或菜单上的Run>RunAs或DebugAs找到。
声明:你问我答网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系fangmu6661024@163.com