toolsets

苏乐童
2023-12-01

font

2 Ubuntu 10.04安装完全指南 李顺亮 2010年4月30日

3 Ubuntu 10.04-Gedit or Vim 中文乱码问题

4 Ubuntu 10.04-Gedit or Vim 中文乱码问题

分类: Linux system 2013-01-17 14:31 32人阅读 评论(0) 收藏 举报 缺省配置下,Ubuntu 的文本编辑器(Ggedit)打开 GB18030/GBK/GB2312 等类型的中文编码文本文件时,将会出现乱码。出现这种情况的原因是,gedit 使用一个编码匹配列表,只有在这个列表中的编码才会进行匹配,不在这个列表中的编码将显示为乱码。只要将 GB18030 加入这个匹配列表即能解决乱码问题。以下是解决方法:

  1. 命令行

gconftool-2 –set –type=list –list-type=string /apps/gedit-2/preferences/encodings/autodetected "[UTF-8,CURRENT,GB18030,BIG5-HKSCS,BIG5,UTF-16]" %%需要变更一下编码顺序,根据需要。

  1. 图形化方式,适用于 Ubuntu 用户,而不适用于 KUbuntu/XUbuntu 用户

步骤如下: 1)按下 Alt-F2,打开“运行应用程序”对话框,键入“gconf-editor”,打开“配置编辑器”。 2)展开左边的树节点,找到 /apps/gedit-2/preferences/encodings 节点并单击它;双击右边的 autodetected 键,单击列表右边的“添加”按钮,输入“GB18030”,单击确定按钮。列表的最底部新增加了一个“GB18030”。单击选中它,并单击右边的 “向上” 按钮直到 “GB18030” 位于列表的顶部为止。 %%改完后根据需要把顺序改回来~

vim 中文显示问题,解决方法如下:打开vim的配置文件,位置在/etc/vim/vimrc,在其中加入 set fileencodings=utf-8,gb2312,gbk,gb18030 set termencoding=utf-8 %%根据需要变更为其他 set encoding=prc 保存退出,此时vim就能正确显示中文了。

vim编码方面的基础知识: ——此处是vim编辑多字节编码文档(中文)所要了解的一些基础知识,注意其没有涉及gvim,纯指字符终端下的vim。

  1. 存在3个变量:

encoding—-该选项使用于缓冲的文本(你正在编辑的文件),寄存器,Vim 脚本文件等等。你可以把 ‘encoding’ 选项当作是对 Vim 内部运行机制的设定。 fileencoding—-该选项是vim写入文件时采用的编码类型。 termencoding—-该选项代表输出到客户终端(Term)采用的编码类型。

  1. 此3个变量的默认值:

encoding—-与系统当前locale相同,所以编辑文件的时候要考虑当前locale,否则要设置的东西就比较多了。 fileencoding—-vim打开文件时自动辨认其编码,fileencoding就为辨认的值。为空则保存文件时采用encoding的编码,如果没有修改encoding,那值就是系统当前locale了。 termencoding—-默认空值,也就是输出到终端不进行编码转换。 由此可见,编辑不同编码文件需要注意的地方不仅仅是这3个变量,还有系统当前locale和、文件本身编码以及自动编码识别、客户运行vim的终端所使用的编码类型3个关键点,这3个关键点影响着3个变量的设定。 如果有人问:为什么我用vim打开中文文档的时候出现乱码? 答案是不确定的,原因上面已经讲了,不搞清楚这3个关键点和这3个变量的设定值,出现乱码是正常的,倒是不出现乱码那反倒是凑巧的。 再来看一下常见情况下这三个关键点的值以及在这种情况下这3个变量的值:

  1. locale—-目前大部分Linux系统已经将utf-8作为默认locale了,不过也有可能不是,例如有些系统使用中文locale zhCN.GB18030。在locale为utf-8的情况下,启动vim后encoding将会设置为utf-8,这是兼容性最好的方式,因为内部 处理使用utf-8的话,无论外部存储编码为何都可以进行无缺损转换。locale决定了vim内部处理数据的编码,也就是encoding。
  2. 文件的编码以及自动编码识别—-这方面牵扯到各种编码的规则,就不一一细讲了。但需要明白的是,文件编码类型并不是保存在文件内的,也就是说没有任何 描述性的字段来记录文档是何种编码类型的。因此我们在编辑文档的时候,要么必须知道这文档保存时是以什么编码保存的,要么通过另外的一些手段来断定编码类 型,这另外的手段,就是通过某些编码的码表特征来断定,例如每个字符占用的字节数,每个字符的ascii值是否都大于某个字段来断定这个文件属于何种编 码。这种方式vim也使用了,这就是vim的自动编码识别机制了。但这种机制由于编码各式各样,不可能每种编码都有显著的特征来辨别,所以是不可能 100%准确的。对于我们GB2312编码,由于其中文是使用了2个acsii值高于127的字符组成汉字字符的,因此不可能把gb2312编码的文件与 latin1编码区分开来,因此自动识别编码的机制对于gb2312是不成功的,它只会将文件辨识为latin1编码。此问题同样出现在gbk,big5 上等。因此我们在编辑此类文档时,需要手工设定encoding和fileencoding。如果文档编码为utf-8时,一般vim都能自动识别正确的 编码。
  3. 客户运行vim的终端所使用的编码类型—-同第二条一样,这也是一个比较难以断定的关键点。第二个关键点决定着从文件读取内容和写入内容到文件 时使用的编码,而此关键点则决定vim输出内容到终端时使用的编码,如果此编码类型和终端认为它收到的数据的编码类型不同,则又会产生乱码问题。在 linux本地X环境下,一般终端都认为其接收的数据的编码类型和系统locale类型相符,因此不需关心此方面是否存在问题。但如果牵涉到远程终端,例 如ssh登录服务器,则问题就有可能出现了。例如从1台locale为GB2310的系统(称作客户机)ssh到locale为utf-8的系统(称作服 务器)并开启vim编辑文档,在不加任何改动的情况下,服务器返回的数据为utf-8的,但客户机认为服务器返回的数据是gb2312的,按照 gb2312来解释数据,则肯定就是乱码了,这时就需要设置termencoding为gb2312来解决这个问题。此问题更多出现在我们的 windows desktop机远程ssh登录服务器的情况下,这里牵扯到不同系统的编码转换问题。所以又与windows本身以及ssh客户端有很大相关性。在 windows下存在两种编码类型的软件,一种是本身就为unicode编码方式编写的软件,一种是ansi软件,也就是程序处理数据直接采用字节流,不 关心编码。前一种程序可以在任何语言的windows上正确显示多国语言,而后一种则编写在何种语言的系统上则只能在何种语言的系统上显示正确的文字。对 于这两种类型的程序,我们需要区别对待。以ssh客户端为例,我们使用的putty是unicode软件,而secure CRT则是ansi 软件。对于前者,我们要正确处理中文,只要保证vim输出到终端的编码为utf-8即可,就是termencoding=utf-8。但对于后者,一方面 我们要确认我们的windows系统默认代码页为cp936(中文windows默认值),另一方面要确认vim设置的termencoding= cp936。

最后来看看处理中文文档最典型的几种情况和设置方式:

  1. 系统locale是utf-8(很多linux系统默认的locale形式),编辑的文档是GB2312或GBK形式的(Windows记事本 默认保存形式,大部分编辑器也默认保存为这个形式,所以最常见),终端类型utf-8(也就是假定客户端是putty类的unicode软件)

则vim打开文档后,encoding=utf-8(locale决定的),fileencoding=latin1(自动编码判断机制不准导致的),termencoding=空(默认无需转换term编码),显示文件为乱码。 解决方案1:首先要修正fileencoding为cp936或者euc-cn(二者一样的,只不过叫法不同),注意修正的方法不是:set fileencoding=cp936,这只是将文件保存为cp936,正确的方法是重新以cp936的编码方式加载文件为:edit ++enc=cp936,可以简写为:e ++enc=cp936。 解决方案2:临时改变vim运行的locale环境,方法是以LANG=zhCN vim abc.txt的方式来启动vim,则此时encoding=euc-cn(locale决定的),fileencoding=空(此locale下文件 编码自动判别功能不启用,所以fileencoding为文件本身编码方式不变,也就是euc-cn),termencoding=空(默认值,为空则等 于encoding)此时还是乱码的,因为我们的ssh终端认为接受的数据为utf-8,但vim发送数据为euc-cn,所以还是不对。此时再用命令: set termencoding=utf-8将终端数据输出为utf-8,则显示正常。

  1. 情况与1基本相同,只是使用的ssh软件为secure CRT类ansi类软件。

vim打开文档后,encoding=utf-8(locale决定的),fileencoding=latin1(自动编码判断机制不准导致的),termencoding=空(默认无需转换term编码),显示文件为乱码。 解决方案1:首先要保证运行secure CRT的windows机器的默认代码页为CP936,这一点中文windows已经是默认设置了。其他的与上面方案1相同,只是要增加一步,:set termencoding=cp936 解决方案2:与上面方案2类似,不过最后一步修改termencoding省略即可,在此情况下需要的修改最少,只要以locale为zhCN开 启vim,则encoding=euc-cn,fileencoding和termencoding都为空即为encoding的值,是最理想的一种情 况。 可见理解这3个关键点和3个参数的意义,对于编码问题有很大助力,以后就可以随心所欲的处理文档了,同时不仅仅是应用于vim,在其他需要编码转换的环境里,都可以应用类似的思路来处理问题解决问题。 最 后推荐一款功能强大的windows下的ssh客户端—-xshell,它具有类似secure CRT一样的多tab 的ssh窗口的能力,但最为方便的是这款工具还有改变Term编码的功能,这样我们就可以不用频繁调整termencoding,只需在ssh软件里切换 编码即可,这是我用过的最为方便的ssh工具。它是商业软件,但非注册用户使用没有任何限制,只是30天试用期超出后会每次启动都提示注册,对于功能没有 丝毫影响

5 Ubuntu 10.04 安装配置指南

http://cainiaobo.blog.51cto.com/4379411/787652 Ubuntu 10.04 安装配置指南 作者:Jandy 版本:1004.1.0504

---

目录

〇、准备 一、安装 二、配置 三、输入法 四、Flash 五、附录 六、更新

---

〇、准备

1、下载Ubuntu光盘镜像文件:http://ubuntuabc.com/123/?p=79

2、校验Ubuntu光盘镜像文件的MD5:http://ubuntuabc.com/123/?p=85

3、备份数据:http://ubuntuabc.com/123/?p=92

4、用U盘制作Live USB:http://ubuntuabc.com/123/?p=18 或者 把.iso文件刻录到光盘:http://ubuntuabc.com/123/?p=56

5、规划分区

1)双系统:

如果你的电脑里已经装有一个Windows系统,而且硬盘有两个以上的分区的话。你需要把其中一个10GB以上的分区删除掉(最好是删除最后一个分区), 以空出一部分未分区的硬盘空间用来安装Ubuntu。这样安装Ubuntu后,系统会自动建立一个启动菜单,让你在开机时选择启动Windows还是 Ubuntu。

在Windows里删除分区的方法是: a)把要删除的分区中的所有文件移到别的分区。 b)右键单击“我的电脑”,选择“管理——磁盘管理”。或“控制面板——管理工具——双击‘计算机管理’——存储——磁盘管理”。 c)右键单击要删除的分区,选择“删除逻辑驱动器”。

双系统的分区大小: swap交换空间:物理内存小于或等于2GB,交换空间为物理内存大小的2倍;物理内存大于2GB的,交换空间等于物理内存大小。 / 分区:空闲空间总容量-交换空间。

2)单系统: 如果你决定在电脑里只安装Ubuntu一个操作系统的话,建议你分3个区: / 分区:8-30G(一般15G就够了); swap交换空间:物理内存小于或等于2GB,交换空间为物理内存大小的2倍;物理内存大于2GB的,交换空间等于物理内存大小; /home:所有剩余空间。

6、网络连接。在Ubuntu里拨号上网比较麻烦,如果你是用ADSL宽带上网,又没有路由器的话,建议你花一百多块钱买个无线路由器,然后在路由器里设置自动拨号,路由器的使用手册里有设置自动拨号的详细说明。 如果你是通过其他方式来连接网络的话,请自行Google连接方法(可参考:http://wiki.ubuntu.org.cn/index.php?title=UbuntuHelp:InternetHowto/zh&variant=zh-cn)。 如果你的网速比较慢,或没有网络的话,建议使用Linux Deepin等中文定制版来安装,否则安装后会没有中文输入法,也不能播放常见的影音文件。

一、安装

1、Ubuntu 10.04的CD镜像里依然没有包含完整的中文语言包和输入法,如果在联网状态下安装的话,安装程序会自动下载语言支持文件,而且2M的ADSL网速下只要几分钟即可下载完毕,所以建议在联网状态下进行安装。 在安装前先打开ADSL的Model和路由器,然后用光盘或Live USB启动电脑。 技巧:开机时猛按F12、F9等功能键可以选择启动设备,具体是哪个键请翻阅电脑说明书,或开机时注意看屏幕下面的提示。

把左边的滚动条拉到底,选择“中文(简体)”,点击“试用Ubuntu 10.04 LTS”。

如果你是用Live USB启动的话,就不会有上面的画面,在启动菜单选择“Default”直接进入桌面。

如果你是用网线联网的话,应该已经自动联好网络,打开Firefox就直接就可以上网了。

如果你是用无线网卡的话,请点击小喇叭左边的网络管理器图标,图标有个红色的叹号表示尚未联网。

选择一个可用的无线网络。

按提示输入无线网络的密码后,很快就可联上网络,这时网络管理器的图标就没有红色的叹号了。

然后双击桌面的“安装 Ubuntu 10.04 LTS”图标进行安装。

语言选择:中文(简体)。如果你喜欢用其他语言的话,就自己看着办吧。

地区选择:默认是“中国(重庆)”,不知为什么。我在上海,所以就选“中国(上海)”。

键盘布局:就用系统建议的“USA”吧。

准备硬盘空间:选“手动指定分区(高级)”。

如果是在一块全新的硬盘上安装的话,要先“新建分区表”。已经进行过分区的硬盘则可以跳过这步。新建分区表会擦除硬盘上的所有数据!

如果你的硬盘不是全新的硬盘的话,就不用新建分区表了,直接选择“空闲”的空间,再点“添加”按钮。

先创建 / 分区:“新分区的类型”选择“主分区”;“新分区的位置”保留默认的“起始”;“用于”“Ext4 日志文件系统”;“挂载点”选择“/”。

再选择“空闲”空间,点击“添加”按钮。

接着创建swap交换空间:“新分区的类型”选“逻辑分区”;“新分区的位置”保留默认的“起始”;“用于”“交换空间”;“挂载点”不用选。

如果是双系统的话,分一个 / 加 一个交换空间 就可以了。 单系统还可以再分一个 /home,挂载点选“/home”就行了,用“Ext4 日志文件系统”。可以参考9.10版的安装指南:http://docs.google.com/fileview?id=0B7vaQCSPJU8PNjUzZmU1ZTItYTVlNi00ZDBmLWFhMzMtN2Q3NDA4MzljMjRm&hl=zh_CN

填写个人资料: “您的名字”可以使用除冒号(:)和逗号(,)以外的任意字符,中间可以有空格。安装后还可以再修改。 “登录名”是开机登录时要输入的用户名,安装后不能再修改。只可以使用英文字母、数字、减号(-)和下划线(),中间不可以有空格,第一个字符必须是英文字母。注意区分字母的大小写,建议全用小写字母。 密码最少要8位,而且不要全是数字或字母,要字母和数字混合。 拿出纸和笔,记下你设置的登录名和密码!注意分清登录名和密码使用的字母的大小写。以免忘记。 如果你对“登录时需要密码并且加密我的主目录”这个选项不熟悉的话,建议不要选择它,以免加密后连自己都无法访问自己的主目录。 填写完毕,点“前进”按钮。

检查一下,没问题的话就点击“安装”按钮开始安装。

安装需要10-15分钟时间,如果屏幕变黑,那可能是因为键盘和鼠标长时间没动作而启动的屏幕保护,动动鼠标就恢复了,不要紧张,更不要强行关机。

Retrieving file 时,如果很慢的话,可以点“跳过”按钮。

下载语言包如果很慢的话,也可以先跳过,等安装完成后再换源下载。

安装完毕,重启电脑。

这行英文的意思是:请取出光盘(Live USB),关上光驱托盘,按回车键(Enter)。

如果你是联网安装的话,安装完毕应该就是中文界面了。 如果你是断网安装,或者在下载语言包时选择了跳过,重启后会提示你“不完整的语言支持”,这时先不要运行,点击“Close”按钮关闭提示。

二、配置

如果你刚装好的Ubuntu没有中文界面、没有中文输入法、不能播放常见的影音文件……请先不要埋怨,这是因为Ubuntu的公司目前的人力财力有限,暂时还不能为每个国家地区发行一个独立的版本,我们可以自己进行配置。

Ailurus这个小程序可以帮助我们更简便地完成对Ubuntu的配置。 先下载Ailurus的安装包,下载地址:http://ppa.launchpad.net/ailurus/ppa/ubuntu/pool/main/a/ailurus/ 我们需要下载扩展名为“.deb”的文件,注意选对版本,比如Ubuntu 10.04的代号是Lucid,就下载“ailurus10.04.2-0lucid1all.deb”。

下载完毕,双击deb文件,点击“Install Package”按钮开始安装。

输入密码。

安装完毕,点击“Close”按钮关闭窗口。

在系统工具菜单里打开Ailurus。

点击“快速安装热门软件”按钮。

选择要配置的项目,但这里安装的浏览器Flash插件不是Adobe的官方插件,安装后也不能播放Google音乐和亦 歌,浏览网页时仍会提示“您需要其他插件以显示此页面的所有媒体”。你可以选择不安装这里的“浏览器的Flash插件”,稍后再手动安装官方的Flash 插件。选好后,点“OK”按钮。

输入密码。

开始下载所需的软件包。

期间可能还会再要输入一到两次密码,请留意提示。

配置完毕,如果你电脑的显卡是集成显卡的话,一般会提示“这个系统上没有使用专有驱动”,这表示Ubuntu系统已经自带显卡驱动了,不需要额外安装驱动。点击“关闭”按钮即可。

再关闭Ailurus的速配窗口。

你还可以用Ailurus来进行其他一些实用的设置,如: 1)如果你不喜欢在桌面“显示已经挂载的卷的图标”的话,可以在“系统设置——桌面”里取消显示。 2)如果你不习惯“最小化”、“最大化”、“关闭”等按钮放在窗口标题栏左边的话,可以在“系统设置——窗口效果”里把“窗口标题栏的按钮的布局”设置回“GNOME经典”。 3)如果你不喜欢“当屏幕保护程序激活时锁定屏幕”的话,可以在“系统设置——GNOME会话”中取消。 4)“安装软件——Nautilus右键菜单”,添加“以管理员身份打开”项。(稍后我们要用到这个功能。)

配置完毕,点击右上角的关闭按钮,选择“Log Out”(注销)或“Restart”(重新启动)。

三、输入法

重启电脑后,界面就变成中文的了。但还没有拼音输入法,还需要再设置一下。如果你是联网安装在安装过程中自动下载语言包的话,可能不需要这一步,安装完毕直接就有拼音输入法了。

左键点击键盘模样的输入法图标,选择“首选项”。

点击“输入法——选择输入法”。

选择“汉语——Pinyin”。

点击“添加”按钮。

选择“汉语 - Pinyin”,点击“向上”按钮,把“汉语 - Pinyin”移动到最上面。

关闭IBus首选项窗口。

然后就可以选择Pinyin输入法输入汉字了。

IBus的候选词排列方向默认是竖直的,你可以在首选项里设置为水平排列。 Pinyin输入法的候选词每排只有5个候选词,你可以点击输入法状态条的“i”按钮,把“Number of candidates”拖到9个。

四、Flash

1)为Firefox浏览器安装Adobe Flash Player Firefox默认没有安装Flash Player的插件,打开有Flash的网页时会弹出提示:“您需要其他插件以显示此页面的所有媒体”,点击“安装缺失插件”进行安装时,会安装失败,需要手动安装,方法如下: 打开网页 http://get.adobe.com/flashplayer/, 点击“Select version to download…”,选择“.deb for Ubuntu 8.04+”,然后点“Agree and Install now”按钮,下载.deb包并保存到桌面或其他文件夹,下载完成后,先关闭所有浏览器窗口,再双击.deb文件进行安装。 安装完毕,关闭浏览器重新打开,就可以显示Flash了。

2)Flash中文字体显示为方块的解决办法 某些软件或网站(如谷歌音乐)的中文字体会显示为方块,进行如下设置即可解决: 点击屏幕左上角的菜单“位置——主文件夹”,点击左边的“文件系统”,用鼠标右键点击文件夹“etc”——选择“以管理员身份打开”,然后再打开文件夹 “/fonts/conf.d/”,右键单击文件 49-sansserif.conf 并选择“打开方式——Gedit”,把倒数第4行的“sans-serif”改为“sans serif”,保存后关闭文件,重新打开网站,就可以正常显示了。

五、附录

Ubuntu常用软件 http://ubuntuabc.com/123/?p=80 Ubuntu/Windows常用软件/应用程序对照表 http://ubuntuabc.com/123/?p=89

六、更新

20100503 开始撰写 20100504 发布

6 Emacs 下处理中文

http://bbs.chinaunix.net/thread-2052823-1-1.html 编码识别 中文用户最头疼的问题就是乱码(其实其他非英语语言也一样)。乱码的原因基本上就是两个:字体和编码。东亚语言的编码系统尤其复杂,和汉语相关的就 有 gbk, gb18030, big5, euc-tw, utf-8, utf-16le, utf-16be 等多种。编码问题不应该让用户来操心,而应该由编辑器、浏览器自行解决。 Unicad 就是就是基于这种想法设计的。Unicad 可以帮助 Emacs 猜测正确的编码,并且在打开文件的时候自动应用,完全不需要用户操心,而且编码识别的正确率非常高,适用的语言包括中文,日文,韩文,希腊语,俄语,保加利亚语,西欧语言,中欧语言。 Unicad 的安装也非常简单,只要 下载最新版本的 unicad.el http://code.google.com/p/unicad/downloads/list ,复制到 load-path 中(比如 site-lisp 目录),然后在 ~/.emacs 里面加上下面这句:

(require 'unicad)

xelatex+xecjk写作模版http://www.douban.com/group/topic/19699717/

http://code.google.com/p/xecjk-template/

 PDF文档的乱码问题
http://wiki.ubuntu.org.cn/PDF%E6%96%87%E6%A1%A3%E7%9A%84%E4%B9%B1%E7%A0%81%E9%97%AE%E9%A2%98
sudo apt-get install poppler-data



Matlab 中文乱码

二.Matlab 中文乱码  

1、Matlab2010的JRE目录为:/ Matlab安装目录/sys/java/jre/glnx86/ jre* 请根据自己的安装目录和版本确定JRE的目录;
2、$ cd / Matlab安装目录/sys/java/jre/glnx86/jre/lib/fonts/;
3、建立目录ChFonts: $ mkdir   fallback (文件夹必须命名为fallback,原因未知 )
4、把字体复制或链接到 fallback目录,选择其中之一就可以:
(1) Windows 的simsun字体
$ cp /media/Windows/WINDOWS/Fonts/simsun.ttc fallback/ 
(2)Linux 文泉驿 (推荐)
$ cp /usr/share/fonts/truetype/wqy/选择一种您喜欢的  fallback/
5、进入 fallback目录,执行 mkfontscale 命令;
$ cd fallback
$ mkfontscale
6、回到上一级菜单:
$ cd ..
7、将上一步生成的文件添加到 lib/fonts/fonts.dir文件中,可用以下命令完成,当然也可以用编辑器复制粘贴:
$ cat fallback/fonts.scale >> fonts.dir
注意  fonts.dir应该设为可写  chmod 644 ./fonts.dir
8、至此Matlab的Java环境中文支持安装完了,接下来配置Matlab;
9、进入Matlab,应该直接能显示出来;没有的话选择 菜单 File>>Preferences>>Fonts 选择SimSun/wqy字体就行了;
问题:选择字体的选择框依然为方块  但是系统中可以显示中文
也可以采用以下方法:〔注:这个方法我并没有试,不知道能不能成功,不过仍拷贝下来了〕
首先使用命令:sudo apt-install sun-java6-jre来安装jre,然后在Matlab的安装路径下的文件,
比如我的是:/usr/X11R6/bin /Matlab7
文件里加入:eport Matlab_JAVA=/usr/lib/jvm/java-6-sun/jre/
然后运行Matlab在file<<preferences<<fonts 选中一种中文字体即可。

Author: fpxshyy <fpxshyy@fpxshyy-desktop>

Date: 2013-02-13 15:38:19 CST

HTML generated by org-mode 6.21b in emacs 23

 类似资料:

相关阅读

相关文章

相关问答