跳到主要內容

備份神級輸入法引擎 RIME 使用者字典

注音輸入法一直以來都是我主要使用的中文輸入法,前一陣子心血來潮想多學一個輸入法以備不時之需,如在沒有注音符號的鍵盤上,也能夠順利的輸入(好卑微的心願 XD)。爲了期待能同時加強英文輸入,選擇了漢語拼音輸入法,因爲漢語拼音最接近注音輸入法,轉移上比較可以微痛就好。

在 uBuntu 的環境中,一開始是用 ibus 裡的拼音,但是 ibus 速度上慢上不少,於是換了一套許多使用者推薦的輸入法框架 fictx (Flexible Context-aware Input Tool with eXtension),真是一套穩定又快速的輸入法框架,用一次就愛上了!

在這個框架下,曾經嘗試了由 Android 移植過來的 Google 拼音(fcitx-googlepinyin)、集結雲端智慧的雲拼音(fcitx-cloudpinyin)、早期昇陽開發的拼音(fcitx-sunpinyin)還有原生的漢語拼音(fcitx-pinyin),可惜的是這幾個輸入法的基礎都是建構在簡體中文的基礎上,當我們要對應至繁體字的時候,有些字就會發生錯誤,如「才」->「纔」,在輸入上帶來相當多的不便。在失望之際,看到一篇文章介紹跨平臺的神級輸入法引擎 RIME 中州韻輸入法引擎,能準確的輸入正體中文的輸入法引擎,且其輸入法引擎的演算法符合拼音、注音、五筆等等。

這是一套跨平臺的輸入法引擎,在 Linux 稱爲「中州韻」、Windows 稱爲「小狼毫」、MACOS 上稱爲「鼠鬚管」,這個引擎的好處請參考上述連結文章的介紹,在此不另做介紹,但小弟我一試成主顧了!

在 uBuntu 14.04 開始 fcitx 已收錄至官方的套件庫,安裝上變的更爲方便了,輸入以下的指令安裝即可完成:
$ sudo apt-get install fcitx fcitx-rime
安裝後開啓「Language Support」將 Keyboard input method system 改爲 fcitx,重新開機就可以使用 fcitx 當作輸入法框架,RIME 作爲輸入法引擎,而我使用的是其中的「朙月拼音」。

在 Linux 中「中州韻」缺少 GUI 的界面來備份使用者的字典檔,每次重新安裝系統我們都無法保留下過去的學習習慣。關於 RIME  的備份方式,在網路上很少看到討論,在一篇對岸論壇中的發文曾間接提及,我們可以透過內建的 rime_dict_manager 工具,來達成備份使用者字典檔的功能。
$ rime_dict_manager
options:
-l|--list
-s|--sync
-b|--backup dict_name
-r|--restore xxx.userdb.txt
-r|--restore xxx.userdb.kct.snapshot
-e|--export dict_name export.txt
-i|--import dict_name import.txt

在這裡我想用的是 sync 的方法來同步資料,將同步的資料夾定至 Dropbox 中即可雲端化。方法為需先設定 ~/.config/fcitx/rime 路徑下的 installation.yaml,在最後加入 sync_dir 項目。
$ vim installation.yaml
...略
installation_id: xxxxxxxxx
sync_dir: "~/Dropbox/YOUBACKUP"

修改後先停止輸入法,在系統輸入法 panel icon 上右鍵選擇 Exit 離開,再以 rime_dict_manager 操作:
$ rime_dict_manager -s
在指定的 Dropbox 資料夾中會出現以 installation id 命名的資料夾,裡面會有 *.userdb.txt 的存文字資料檔,可以定期手動的備份一下或是寫一個簡單的 shell script 執行定時備份同步 :)。

留言

這個網誌中的熱門文章

Word的合併列印如何出現「千分位」符號

今天樓下的同事突然問我一個問題,合併列印的時候如何顯示「千分位符號」(逗號),就是12 , 300。在Excel我們可以很容易的為儲存格裡的數字加上千分位的標記,但是儲存格實際儲存的還是只有數字,那個千分位符號是Excel給我們看的一種「格式」。 當我們在Word裡使用Excel做好的報表來合併列印的時候,Word會最真實的將這個數字欄位給讀出來,呈現在合併列印的欄位數值裡,無論在Excel理事不是有設定千分位符號,在Word合併列印後卻沒有出現,所以我們同樣的必須給他加上格式。 Word裡加上格式並不如Excel裡按一下就完成,加上逗號的千分位格式方法如後: 1.在Word裡插入合併列印的欄位變數。 2.在變數上按滑鼠右鍵,選擇「切換功能變數代碼」(也可以直接按Alt+F9),變數會由 << 經費 >> 變成 { MERGEFIELD "經費" } 。 3.加上格式就是把 { MERGEFIELD "經費" } 在}前加入數字格式參數 /##,###,會成為 { MERGEFIELD "經費" /# ##,### }(這裡指定五位數,以此類推) #:這個格式項目會指定要在結果中顯示的必要位數;如果結果不含該位數的數字,則 Word 會顯示一個空格。 0:這個格式項目會指定要在結果中顯示的必要位數;如果結果不含該位數的數字,則 Word 會顯示 0 (零)。 4.預覽內容,就可以發現千分位(逗號)出現,如果數值有零的話,最好可以換成 /# ##,## 0 ,避免空格出現。 數字格式參數請參考 Microsoft Office Online 。

在DOS下檔案名稱加上日期

由於要完成檔案自動備份的需求,以減少每日使用人工的麻煩,也可以避免人為疏失造成的遺漏,需要定時拷貝某個檔案至遠端,在檔名加上日期以避免檔案覆蓋的情形。由於近來接觸Linux較多,自然比較熟悉Linux的Shell語法,回到Windows裡卻想不到解決的方法。 開始使用電腦時,已經活生生的跳過了DOS的年代,雖然會使用Copy語法,卻不知怎麼加上系統日期,參拜估狗大師後得到了解答,使用%DATE%環境變數。 在DOS中使用date會顯示目前日期,但會要求輸入新的日期時間不符合需求,雖然加上"/T"不會詢問新時間,但因為date是指令無法使用在copy的語法中,所以我們使用%DATE%環境變數,所以在我們要加上日期的檔案上加上此環境變數:copy test.txt test_%DATE%.txt 結果並不如我們想像,使用echo看%DATE%的傳回值,會出現"2007/12/4",使用於copy語法裡系統回應「命令語法不正確」,我們必須去除「/」的符號,這就需要用到環境變數的擴充功能了! 用echo來測試: # echo %DATE:~0,4% : 取環境變數%DATE%的值,由第一碼開始取四碼(可以取出"西元年"的值)。 # echo %DATE:~5,2% :取環境變數%DATE%的值,由第六碼開始取二碼(可以取出"月"的值)。 # echo %DATE:~8,2% :取環境變數%DATE%的值,由第九碼開始取二碼(可以取出"日"的值)。 原先的 #copy test.txt test_%DATE%.txt 要更改成 #copy test.txt test %DATE:~0,4% %DATE:~5,2% %DATE:~8,2% .txt 拷貝後的檔案為test_20071204.txt

DOS下連線/中斷網路磁碟機

最近實在是不得不和DOS多一點親近,在Linux中我們可以mount遠端電腦NFS分享出來的資料夾來做存取,輕易的備份我們需要的資料後再unmount,很Easy~:) 原本想在Windows下更應該輕而易舉的完成「連線網路磁碟機」用來將資料備份至遠端的電腦(或是遠端儲存設備)。沒錯,的確可以簡單的連線網路磁碟機,但當我們設定排程自動執行批次檔(*.bat)來進行遠端備份的工作時,windows就發揮他暈倒的功力......很抱歉,登出以後,剛剛建立的「連線網路磁碟機」就自動"中斷"了,批次檔裡寫的檔案路徑形同無效路徑。 只好繼續參拜估狗大神,以期保佑永不當機...不對,是在DOS下連線到網路磁碟機啦! DOS下我們要使用連線網路磁碟機,必須使用 net use 指令。 連線網路磁碟機: # net use x: \\ComputerName\ShareName "Password" / user: DottedDomain\UserName x :要對應至本機磁碟的代號 \\ComputerName\ShareName :遠端電腦及分享資料夾名稱 /user:DottedDomain\UserName :連線使用者名稱 例如: # net use z: \\192.168.0.10\sharefolder 連線至192.168.0.10的sharefolder對應至本機的z磁碟 # net use z: \\192.168.0.10\sharefolder "test" /user:192.168.0.10\Jeffy 連線至192.168.0.10的sharefolder對應至本機的z磁碟,連線時使用"Jeffy"連線密碼為"test" 連線網路磁碟機後,及可以直接切換磁碟機代號進入遠端連線的資料夾,進行copy或其他指令動作,完成任務後再中斷網路磁碟。 中斷網路磁碟機: # net use x: /delete x :連線的網路磁碟機代號 更詳盡的net use使用方式和參數請見 Microsoft Net use 。