Word简繁转换中易错字识别更正工具
苏卫国
2005-11-25 03:43:13 作者授权,象牙塔提供免费下载
工具开发缘起
业内人士常常会有呈交繁体文稿的经历,需要将简体中文原稿转为繁体。
目前,文本的简繁转换已经不是什么难事了。自 Office 2000 以来,大家已经对 Word 工具栏中的“简繁转换”按钮非常熟悉了,并且它的转换效果也不错。(另外,论坛中曾有人提到的 ConvertZ 软件,在简繁转换方面更有其独到之处。)
不过,尽管 Word 的简繁转换为我们省了很多功夫,它却做不到百分之百的正确。比如:Word 认识“乙丑”,但却不认识“丁丑”、“辛丑”、“癸丑”,转换后你会看到“丁醜”这种怪怪的写法。又如:“廿五里”好象不该写成“廿五裏”。所以,要想做一个严谨的学者,在同行面前不丢面子,剩下的核校工作也是非常折磨人的。
商业产品着眼于当代文字和语言,开发者会考虑港台与大陆的语汇差异,却不会在文字的古义上费太多的心思(用户自定义虽有助于问题的解决,但穷尽谈何容易)。而且,一般人也不会对如“御史”写成“禦史”有什么不舒服的感觉,甚至还会觉得这种写法颇具古韵。因此,剩下的事情就只能由我们自己来做了。
用法简介
好在微软的产品总是给人很多的自由发挥空间,智能标识就是其中的一种,本人尝试利用这一手段来达到简繁转换的“拾遗补阙”的目的。至于“智能标识”的基本知识,大家可能通过 Word 的帮助去了解,恕不赘言。
工具目前有两个主要的功能,一是“更正”,一是简单的提示,以便用户自行决定何去何从。为解决智能标识不明显的弊端,又加了一个辅助工具(调用方法见下),用于突出显示被标识的字,以免有所遗漏。
与此工具相关的 Word 用法提示
1.如何开关智能标识。
单击:菜单→工具→自动更正选项。
在弹出的对话框中选择“智能标识”页,选择或去除相应的选项。
2.如何调用辅助工具栏。
单击:菜单→工具→模板和加载项。
在弹出的对话框中选择“模板”页,如“共用模板和加载项”的列表中有备选项,则选择,没有则按“添加”,在打开文件对话框中,选择“Tchar”文件,待“共用模板和加载项”的列表更新成功后,勾选该项并确定即可。
已收字
1 後 后 用为尊称或姓氏时,不宜用後。如:遼后、后土、后倉、后羿等。
2 醜 丑 用为地支名称时不宜用“醜”。如:丁丑等。
3 裏 里 用为居里或道里讲时不宜用“裏”。如:里坊;廿五里等。
4 禦 御 用为“驾御”之意时不宜用“禦”。官称“御史”不宜用“禦”。
5 穀 谷 一般,用为姓氏或非五谷之意时不宜用“穀”。
6 強 强 “強”与“强”实并无差别。
7 鬥 斗 用为容积单位时不宜用“鬥”。
8 么 幺 从“幺”到“么”的转换另人费解。尽管字书中讲“幺,今俗作么。”不过,当“幺”字被两次简繁转换后,它将会变成“麽”字!建议你还是用“幺”原字比较好。
9 谷 穀 一般情况下,Word简繁转换能够胜任“谷/穀”的互换。不过也有例外,如:錢穀。
10 麽 幺 仅在很个别的情况下会出现错误。即,当“幺”字被两次简繁转换后,它将会变成“麽”字!如果文中原字为“幺”,建议你还是用“幺”原字比较好。
11 於 于 两字在古籍中常常并存,多数情况下亦通用,但不该混同的场合也有,如“于”作姓氏讲时。
12 並 并 两字在古籍中常常并存,用法亦有差异,如牂柯郡的“同並”就只能用“並”,读为伴。大略言之,“并”为两人相从,有聚合连结之意;而“並”为两“立”相比,似乎有对立匹敌的意味。又,并异作幷,並异作竝。
13 徵 征 两字在古籍中常常并存。概言之,征有远行义,徵则有“召”之义,进而有徵兆迹象及证验之转义。
14 雲 云 最常见的就是作“说”讲时,当用“云”。
建议
很自然,一个人的学力有限,无法发现太多的转换问题。
所以,这里有个建议,有心者不妨将发现的转换错误反馈给我,以便本软件能陆续更新,方便大家。
安装要求
最后,还要讲一下软件安装的要求。Office一定要是2002以后的版本,因为这个版本以后 Word 才支持“智能标识”。又,此软件所识别出的标识只适合用于WORD当中,在OFFICE的其他产品中用,可能会出问题。因为没有在不同环境下测试,有问题可以给我发信来反馈,以便更正。
联系方式
suweiguo@etang.com
“Word简繁转换中易错字识别(更正)工具”修订版说明
1.数据记录增加至100余行。
能识别的字包括:
--------------------------------------
○ 有效字例 169 (其中:一级 151 例,二级 18 例)
板闆辟錶彆並蔔纔采採廠沖衝蟲讎醜蔥擔當黨冬鬥惡兒發髮范範複復幹谷穀颳廣櫃合後鬍劃壞匯彙夥獲穫饑幾繫家價薑借藉盡儘據卷捲克剋困睏臘蠟纍累漓灕裏曆歷簾了瞭鹵么黴蒙彌面麵蔑衊麽寧闢蘋僕樸簽籤韆縴強秋鞦曲麯確舍捨沈瀋勝适適术術松鬆蘇台臺颱檯壇罎體塗團糰萬系係纖咸鹹嚮向須鬚旋镟藥叶葉傭余於餘與吁禦鬱籲願嶽芸雲髒臟折摺徵症隻制致製緻鍾鐘種朱筑築准準
○ 另有 43 例是几乎不可能出错,但又属简繁不对称对应关系中者,暂列于下(如有用户认为哪个需加入上面有效字例中,请来信说明原因,本人将酌情加以处理,以求软件之完善):
擺表別卜才丑出齣葱鼕噁干刮后胡划回迴伙飢几傢姜里裡帘霉朴千乾葯郁御愿岳云沄澐蕓征衹只硃
(详情可在数据库的窗体中查看,位置在程序安装文件夹中)
---------------------------------
2.数据分为两级。一级为不更改有悖字义者,一般可满足大多文史工作者的需要。二级为不更改于字义无碍,但字型可能与原文有誖的,主要是针对那些完全忠实于原文的古文献整理、文字研究等需要。
3.数据采用数据库来记录。与动态链接库分离,便于数据的动态更新。
4.智能标识中的按钮“更正”改为“更正或给出备选项”。“给出备选项”是某字有多种修改可能时,以备选形式给出,如“強”,在按下按钮后,该字会被“〖Option: 强彊〗”代替。请使用者自行选择,并删除无用文字。
5.两级数据的标识采用不同的颜色,可通过工具栏按钮来分别控制。
6.改正了按钮点击后,编辑点不能固定在此标识处的问题。
=====================
可能还存在的问题:
有时可能会出现无法识别表格中文本的现象,所以要对表格特殊留意,以免误事。(当然这种情况是非常少见的,猜测可能是因从其他程序复制来的表格与 Word 自身形成的表格有所不同的缘故)
如确有此类事情,可采取临时解决办法:先将表格转为文本,识别,然后再将相应的文本转为表格。
编辑:陈爽
点击此处下载“Word简繁转换中易错字识别更正工具(2005-11-30修订版)”