Ubuntu 上安装使用 ibus-rime(超实用)
RIME/中州韵输入法引擎(Rime Input Method Engine),是一个跨平台的输入法算法框架。基于这个算法框架开发的输入法,可以粗暴的称为 Rime 输入法。然而,每个平台都有各自的名称:
【中州韵】 ibus-rime → Linux
【小狼毫】 Weasel → Windows
【鼠须管】 Squirrel → Mac OS X
其实这个都很好理解,不同平台不同的软件嘛。我在什么平台我下载对应的软件安装就行了,根本不用 Care 其他平台叫什么名字。
但我要吐槽 RIME 的官方文档,居然把各平台的使用说明杂糅在一起,其最大效果就是让新手「头晕」。
应该把不同平台的软件使用说明独立出来,比如小狼毫使用说明、鼠须管使用说明、中州韵使用说明。我用 ibus-rime,只看 ibus-rime 的说明就可以了嘛,干嘛要给我看小狼毫和鼠须管的使用说明。
在 Linux 下有两大主要的输入法支持框架:fcitx 和 IBus。
fcitx 是 Free Chinese Input Toy for X 的简称。
IBus 是 Intelligent Input Bus 的简称。
Rime 二者都支持,有 ibus-rime 和 fcitx-rime 两个版本。值得注意的是,基于 Fcitx 输入法框架的 fcitx-rime 是第三方软件,由 Fcitx 团队开发和维护。参阅 Linux 下的输入法 fcitx vs ibus
ibus-rime 安装
Ubuntu 上直接使用命令安装:
sudo apt-get install ibus-rime
sudo apt-get install librime-data-wubi librime-data-pinyin-simp librime-data-stroke-simp
安裝更多輸入方案,参阅 RimeWithIBus · GitHub
按组合键 Ctrl+` 或 F4 键唤出输入方案选单,由此调整 Rime 输入法最常用的选项。您可通过方案选单切换已经安装的输入方案。
ibus-rime 必知必会
输入法代号:ibus-rime
用户资料夹: ~/.config/ibus/rime/
共享资料夹: /usr/share/rime-data/
共享资料夹包含预设输入方案的源文件。 这些文件属于 Rime 所发行软件的一部份,在访问权限控制较严格的系统上对用户是只读的,因此谢绝软件版本更新以外的任何修改—— 一旦用户修改这里的文件,很可能影响后续的软件升级或在升级时丢失数据。
在「部署 Rime」操作时,将用到这里的输入方案源文件、并结合用户定制的内容来编译预设输入方案。
「用户资料夹」数据说明
用户资料夹则包含为用户准备的内容,如
〔全局設定〕 default.yaml
〔發行版設定〕 ibus-rime.yaml
〔預設輸入方案副本〕 <方案标识>.schema.yaml ibus-rime.schema.yaml
※〔安裝信息〕 installation.yaml
※〔用戶狀態信息〕 user.yaml
编译输入方案所产出的二进制文件:
〔Rime 棱鏡〕 <方案标识>.prism.bin
〔Rime 固態詞典〕 <词典名>.table.bin
〔Rime 反查詞典〕 <词典名>.reverse.bin
记录用户写作习惯的文件:
※〔用戶詞典〕 <词典名>.userdb.kct
※〔用戶詞典快照〕 <词典名>.userdb.txt、<词典名>.userdb.kct.snapshot 見於同步文件夾
以及用户自己设定的:
※〔用戶對全局設定的定製信息〕 default.custom.yaml
※〔用戶對預設輸入方案的定製信息〕 <方案标识>.custom.yaml
※〔用戶自製輸入方案〕及配套的詞典源文件
注:以上标有 ※ 号的文件,包含用户资料,您在清理文件时要注意备份!
ibus-rime 定制
定制指南
当用户需要对 Rime 中的各种设定做小幅的调节,最直接、但不完全正确的做法是:编辑「共享资料夹」中那些 .yaml 文档(/usr/share/rime-data/ )。
这种方法有很大缺陷:
当 Rime 软件升级时,也会升级各种设定档、预设输入方案。用户编辑过的文档会被覆盖为更高版本,所做调整也便丢失了。
软件升级后,你不能将备份文件直接覆盖升级后的文件。这将失去本次升级所新增和修复的功能。唯一的方法是,重新编辑升级后的文件。
因此,对于随 Rime 发行的设定档及预设输入方案,推荐的定制方法是:
在「用户资料夹」下创建 .yaml 定制文档;比如
default.yaml 的定制文件名为 default.custom.yaml
luna_pinyin 的定制文件名为 luna_pinyin.custom.yaml
luna_pinyin_simp 的定制文件名为 luna_pinyin_simp.custom.yaml
symbols.yaml 的定制文件名为 symbols.custom.yaml
规范为在文件名主体(ID)和 .yaml 之间增加次级扩展名 .custom。定制文档的书写格式为:
patch:
“一级设定项/二级设定项/三级设定项”: 新的设定值
“另一个设定项”: 新的设定值
“再一个设定项”: 新的设定值
“含列表的设定项/@n”: 列表第n个元素新的设定值,从0开始计数
“含列表的设定项/@last”: 列表最后一个元素新的设定值
“含列表的设定项/@before 0”: 在列表第一个元素之前插入新的设定值(不建议在补丁中使用)
“含列表的设定项/@after last”: 在列表 “一级设定项/二级设定项/三级设定项”: 新的设定值最后一个元素之后插入新的设定值(不建议在补丁中使用)
“含列表的设定项/@next”: 在列表最后一个元素之后插入新的设定值(不建议在补丁中使用)
就是这样:patch 定义了一组「补丁」,以源文件中的设定为基础,写入新的设定项、或以新的设定值取代现有设定项的值。
每次修改配置文件,你需要重新部署来生效。
重新部署的操作方法
点击输入法的程序指示器,选择「部署」
点击输入法状态栏上的 ⟲ (Deploy) 按钮。如果找不到状态栏,在终端输入以下命令,可触发自动部署:
rm ~/.config/ibus/rime/default.yaml; ibus-daemon -drx
定制每页候选数
Rime 中,默认每页至多显示 5 个候选项,而允许的范围是 1〜9(个别 Rime 发行版可支持 10 个候选)。
设定每页候选个数的默认值为 9,在用户目录建立定制文档 :
vi ~/.config/ibus/rime/default.custom.yaml
patch:
“menu/page_size”: 9
重新部署即可生效。
或者重启 ibus-deamon
ibus restart
注意! 如果 default.custom.yaml 里面已经有其他设定内容,只要以相同的缩进方式添加 patch: 以下的部分,不可重复 patch: 这一行。
定制方案选单
vi ~/.config/ibus/rime/default.custom.yaml:
patch:
schema_list: # 對於列表類型,現在無有辦法指定如何添加、消除或單一修改某項,於是要在定製檔中將整個列表替換!
- schema: luna_pinyin
- schema: cangjie5
- schema: luna_pinyin_fluency
- schema: luna_pinyin_simp
- schema: my_coolest_ever_schema # 這樣就啓用了未曾有過的高級輸入方案!其實這麼好的方案應該排在最前面哈。
调整方案候选顺序,增加输入法方案,或者通过 # 注释内容将不用的方案移除候选菜单。
重新部署生效。
定制字体字号
GNOME 桌面可以使用扩展 IBus Tweaker。
以下方法不适用 ibus-rime:
patch:
“style/font_face”: “明兰” # 字體名稱,從記事本等處的系統字體對話框裏能看到
“style/font_point”: 16 # 字號,只認數字的,不認「五號」、「小五」這樣的
定制皮肤
没有必要浪费时间,默认就简洁美观。
输入符号
符号文件 /usr/share/rime-data/symbols.yaml 开头已经说明了使用方法:
想在朙月拼音·简化字 luna_pinyin_simp 方案下输入符号,就新建 luna_pinyin_simp.custom.yaml:
patch:
punctuator/import_preset: symbols
recognizer/patterns/punct: ‘^/([0-9]0?|[A-Za-z]+)$’
重新部署生效。
输入符号请键入识别码:
星号 /xh
箭头 /jt
數字 /1
更多符号参阅文件 symbols.yaml。
其他方案下输入符号,照葫芦画瓢。
符号自定义
拷贝 /usr/share/rime-data/symbols.yaml 为 ~/.config/ibus/rime/symbols.custom.yaml。在末尾添加自定义符号:
'/yx': [ xiaoming@gmail.com, xiaoming@163.com, 1234567910 ]
'/gc': [ ✓, ☑, ✗, ☒ ]
想在朙月拼音·简化字 luna_pinyin_simp 方案下输入符号,就修改 luna_pinyin_simp.custom.yaml 文件内容为:
patch:
punctuator/import_preset: symbols.custom
recognizer/patterns/punct: ‘^/([0-9]0?|[A-Za-z]+)$’
重新部署生效。
朙月拼音·简化字扩展词库
朙(míng)同“明”
下载词库,将下面几个文件的 luna_pinyin 修改为朙月拼音·简化字 luna_pinyin_simp:
luna_pinyin.hanyu.dict.yaml
luna_pinyin.poetry.dict.yaml
luna_pinyin.cn_en.dict.yaml
luna_pinyin.extended.dict.yaml
文件名和文件内容都需要同步修改。比如 luna_pinyin_simp.extended.dict.yaml,并同步修改文件内的方案 ID。
import_tables:
接着将四个文件移动到用户资料夹 ~/.config/ibus/rime 下。
其后,将 luna_pinyin.custom.yaml 中的内容添加到 luna_pinyin_simp.custom.yaml 中。
patch:
punctuator/import_preset: symbols
recognizer/patterns/punct: ‘^/([0-9]0?|[A-Za-z]+)$’
translator/dictionary: luna_pinyin_simp.extended
speller/algebra/@before 0: xform/^([b-df-hj-np-tv-z])$/$1_/
重新部署生效。
其他扩展词库,xiaoTaoist 制作的词库扩展包,GitHub 地址。
增加自己的词库
我们可以仿照上一步的词典文件建立自己额外的词典,增加自己的词汇。例如,建立名为 my.dict.yaml 的文件,然后参照 luna_pinyin_simp.cn_en.dict.yaml 添加几个自己常用的词汇,文件内容如下:
name: my
version: “2020.05.28”
sort: by_weight
use_preset_vocabulary: true
…
GitHub github 100
Stack Overflow so 1000
词典的格式为: 词汇编码词频,各个项目之间必须用 Tab(也就是制表符 )分割。一个最保险的方法就是,复制粘贴。词频部分可以不要。
然后在 luna_pinyin_simp.extended.dict.yaml 的 import_tables 中加上自己建立的词汇。
import_tables:
一切添加妥当之后,重新部署生效。
导入其他词库
将搜狗输入法词库导入 RIME、将百度输入法词库导入 RIME……一搜便知,无需赘述。
朙月拼音·简化字默认英文
如果经常和英语打交道,偶尔输入汉字,可以把朙月拼音初始状态设为英语,需要时再切回中文。参考 这里 给出的说明,在 luna_pinyin_simp.custom.yaml 文件中加入下面的设置:
patch:
“switches/@0/reset”: 1 # 初始的 ascii mode 设置为「西文」
模糊拼音
这里是官方给的一个模板 (朙月拼音)。将模板剪贴进 ~/.config/ibus/rime/luna_pinyin_simp.custom.yaml 文件中,然后需要哪组就去掉那一行前面的 # 即可。
patch:
‘speller/algebra’:
- erase/^xx$/ # 第一行保留
# 模糊音定義
# 需要哪組就刪去行首的 # 號,單雙向任選
#- derive/^([zcs])h/$1/ # zh, ch, sh => z, c, s
#- derive/^([zcs])([^h])/$1h$2/ # z, c, s => zh, ch, sh
#- derive/^n/l/ # n => l
#- derive/^l/n/ # l => n
# 這兩組一般是單向的
#- derive/^r/l/ # r => l
#- derive/^ren/yin/ # ren => yin, reng => ying
#- derive/^r/y/ # r => y
# 下面 hu <=> f 這組寫法複雜一些,分情況討論
#- derive/^hu$/fu/ # hu => fu
#- derive/^hong$/feng/ # hong => feng
#- derive/^hu([in])$/fe$1/ # hui => fei, hun => fen
#- derive/^hu([ao])/f$1/ # hua => fa, ...
#- derive/^fu$/hu/ # fu => hu
#- derive/^feng$/hong/ # feng => hong
#- derive/^fe([in])$/hu$1/ # fei => hui, fen => hun
#- derive/^f([ao])/hu$1/ # fa => hua, ...
# 韻母部份
#- derive/^([bpmf])eng$/$1ong/ # meng = mong, ...
#- derive/([ei])n$/$1ng/ # en => eng, in => ing
#- derive/([ei])ng$/$1n/ # eng => en, ing => in
# 樣例足夠了,其他請自己總結……
# 反模糊音?
# 誰說方言沒有普通話精確、有模糊音,就能有反模糊音。
# 示例爲分尖團的中原官話:
#- derive/^ji$/zii/ # 在設計者安排下鳩佔鵲巢,尖音i只好雙寫了
#- derive/^qi$/cii/
#- derive/^xi$/sii/
#- derive/^ji/zi/
#- derive/^qi/ci/
#- derive/^xi/si/
#- derive/^ju/zv/
#- derive/^qu/cv/
#- derive/^xu/sv/
# 韻母部份,只能從大面上覆蓋
#- derive/^([bpm])o$/$1eh/ # bo => beh, ...
#- derive/(^|[dtnlgkhzcs]h?)e$/$1eh/ # ge => geh, se => sheh, ...
#- derive/^([gkh])uo$/$1ue/ # guo => gue, ...
#- derive/^([gkh])e$/$1uo/ # he => huo, ...
#- derive/([uv])e$/$1o/ # jue => juo, lve => lvo, ...
#- derive/^fei$/fi/ # fei => fi
#- derive/^wei$/vi/ # wei => vi
#- derive/^([nl])ei$/$1ui/ # nei => nui, lei => lui
#- derive/^([nlzcs])un$/$1vn/ # lun => lvn, zun => zvn, ...
#- derive/^([nlzcs])ong$/$1iong/ # long => liong, song => siong, ...
# 這個辦法雖從拼寫上做出了區分,然而受詞典制約,候選字仍是混的。
# 只有真正的方音輸入方案纔能做到!但「反模糊音」這個玩法快速而有效!
# 模糊音定義先於簡拼定義,方可令簡拼支持以上模糊音
- abbrev/^([a-z]).+$/$1/ # 簡拼(首字母)
- abbrev/^([zcs]h).+$/$1/ # 簡拼(zh, ch, sh)
# 以下是一組容錯拼寫,《漢語拼音》方案以前者爲正
- derive/^([nl])ve$/$1ue/ # nve = nue, lve = lue
- derive/^([jqxy])u/$1v/ # ju = jv,
- derive/un$/uen/ # gun = guen,
- derive/ui$/uei/ # gui = guei,
- derive/iu$/iou/ # jiu = jiou,
# 自動糾正一些常見的按鍵錯誤
- derive/([aeiou])ng$/$1gn/ # dagn => dang
- derive/([dtngkhrzcs])o(u|ng)$/$1o/ # zho => zhong|zhou
- derive/ong$/on/ # zhonguo => zhong guo
- derive/ao$/oa/ # hoa => hao
- derive/([iu])a(o|ng?)$/a$1$2/ # tain => tian
#‘translator/preedit_format’:
同步用户资料
默认地,词典快照备份到 ~/.config/ibus/rime/sync/UUID 这个地方。我们可以设定同步的目标文件夹,直接编辑 ~/.config/ibus/rime/installation.yaml:
sync_dir: ‘/DATA/Backup/RimeSync’
然后,点击输入法程序指示器选择「同步」。你的 用户配置、用户词库 等都会被放在目标文件夹。
注意!可能有些你自己添加的文件不会被备份,注意下就行。
我们可以借助移动存储设备,或在线存储服务如百度网盘、坚果云等,在多台电脑及不同系统之间同步用户词典和用户设定。在新电脑上配置一下 installation.yaml 文件,执行 部署 -> 同步 -> 部署 ,你的 用户配置、用户词库 都回来了。
新世纪五笔
参阅 https://github.com/GuoBinyong/wubixinshiji。Rime输入法之五笔自动上屏。
后续配置来自视频 rime 中的小狼毫输入法的安装和基础自定义 所分享的文件: https://www.lanzous.com/ia2g86h。
Easy english
用于输入英文。拷贝下面两个文件到「用户资料夹」:
easy_en.schema.yaml
easy_en.dict.yaml
vim default.custom.yaml 添加输入方案:
schema_list:
- schema: wubixinshiji # 新世纪五笔
- schema: wubixinshiji_pinyin # 新世纪五笔·拼音
- schema: luna_pinyin_simp # 朙月拼音·简化字
- schema: easy_en
- schema: pinyin_simp # 袖珍简化字拼音
输入日期(不适用中州韵)
将文件 rime.lua 拷贝到 ~/.config/ibus/rime/ 下,在方案配置文件比如 wubi86.schema.yaml 的 engine\translators: 下面添加滤镜引用:
translators:
- lua_translator@date_translator
- lua_translator@week_translator
更多中州韵输入法(ibus-rime)配置,请阅读晦涩的官方文档:
RimeWithSchemata
CustomizationGuide
See also
Rime (简体中文)
致第一次安装RIME的你
最新版 Rime 输入法使用
ubuntu ibus-rime 设置
Ubuntu下Rime安装配置
最新版 Rime 输入法使用
GNU/Linux 输入法折腾笔记 (RIME)