【世界公民】牛津词典收了几个中文词?

2020-06-12 阅读264 点赞226
【世界公民】牛津词典收了几个中文词?

2018 年 10 月中旬,我首度发现直译自中文「加油」的 add oil 收进了《牛津英语词典》,这个语言上的现象引爆了广泛且高度的热议,不仅红遍海峡两岸及香港、澳门,甚至传播到了东南亚与北美的华语圈。许多英文媒体跟进报导,就连本该与此无关的日本、西班牙、法国、土耳其等国,也能看到这条汉英语言的新闻。

于此稍早的 10 月上旬,我的另一个发现就冷清许多,没受到什幺关注。OED 在其年度第 3 季的更新中,增收了源自中文、汉传佛教「禅」的音译词 Chan,这则添补得以让英语世界认识到,禅宗不是只有日本的 Zen,更有日本禅宗源头的中国禅宗。

【世界公民】牛津词典收了几个中文词?

我研究 OED 多年,常有学界的前辈、朋友问我,在这部英语世界的词彙宝库里,究竟收录了多少源自中文的词语?网上有人说 120 个,有人说 200 多个,甚至有人说 1000 多个。数字差距如此悬殊,到底哪一个答案才对?

答案应该是官方说法的两倍

2018 年 11 月 19 日,牛津大学出版社的词典部总编辑刘浩贤出面,在接受媒体的採访时表示,英国 OED 编辑部提供的数字是 250 个。

牛津英国总部的说法看似一槌定音,然而我却半信半疑。胡适曾说,做学问要在不疑处有疑,于是我便在众说纷纭之中,花了一週的时间,从早到晚密集研究。根据我得出的第一手资料,我的答案是 500 个左右,数字是 OED 官方说法的两倍。

在回答问题前,请容我先把必要的背景说明一下。

如何统计英语词典里的中文字?

我在 2005 年曾经做过一个类似的研究,不过对象是规模较小、2 大册的《牛津英语词典简编》。这套 SOED 是 20 大册完整版 OED 的节本 ,当年的统计数字是 250 个左右,详细的词表发布在大陆的《广东外语外贸大学学报》上。

如果有人认为,「2 大册有 250 个中文词语,20 大册是 10 倍的规模,所以中文词语的总数就是 2500 个」,如此推论就差之毫釐、谬以千里了,因为这不是个简单的算术问题。简编版的 SOED 保留了完整版 OED 大多数的词语条目,只是在词源、定义、书证等其他地方删节压缩。是故,欲知 OED 收录了多少中文词语,这研究还得从头做起,无法贪快,没有捷径可走。

有几个观念也得界定釐清,否则这项研究无法进行。

判定标準一:源自中文,还必须是「汉语」

首先,什幺是源自中文的词语?这问题看似容易,实则不然。根据大陆权威的《现代汉语词典》所载,中文是「中国的语言文字,特指汉族的语言文字」。準此,OED 收录的 Kalgan,用来指称张家口特产的羊毛皮,因其源自蒙古语,我就觉得不该算。同理,OED 收录的 Lhasa Apso源自藏语,也不能算是源自中文的词语。然而,OED 收录的 hutung就得算,因为追本溯源,「胡同」虽来自蒙古语,唯其汉化已深,早已是汉语词彙的坚定的一员。OED 也收录了 Manchu,该词虽源自满州语,道理同上,也得算是源自中文的词语。

实际的情况,有些并非这幺黑白分明。碰到棘手的例子,我只能运用我的专业知识,在几分挣扎之后,逐一迅速下判断了。

判定标準二:音译、借译才算外来语

另外,怎幺样的中文词语才算是英文里的「外来语」?我认为「异化」较深的才算,这其中包含两大类。其一是音译词,如:

【世界公民】牛津词典收了几个中文词?

其二是借译词,如:

【世界公民】牛津词典收了几个中文词?

当然,这个部分在操作的时候,情况也没有想像中的清楚明了,有时还得根据自身的认知加以取捨。兹举数例。英文里有些音译词最终来自中文,然而却是透过其他语言进入英文的,如:

【世界公民】牛津词典收了几个中文词?

我基于理性,把这类词排除在外,但做这个决定时,心里是有几分痛苦和不平的。

英文有些依中文而造的借译词,结构、内容上并不够严谨,如:

【世界公民】牛津词典收了几个中文词?

碰到这种情况,我依照OED的词源和定义,参考汉英词语之间的吻合度,做出综合判断。「红包」的red envelope和「燕窝」的bird’s-nest soup,此二者我把它们纳入计算,视之为英文里来自中文的借译词。

如果概念事物是中国的,但英文的对应是相对自由的意译,我便倾向于将之排除在外,如:

【世界公民】牛津词典收了几个中文词?
500个中文词语,多数不亲民

1989 年第 2 版的 OED 有 20 大册,纸质词典只能用于个别词语的翻查浏览,无法做系统、深入的学术研究。最新的 OED 是个有偿使用的超大型线上词典,是个在第 2 版的基础上整合更新而成的巨型电子资料库。

身为 OED 的订户,我藉由官网上的进阶搜寻 ,配合地毯式的审阅与交叉求证,电脑、手动双管齐下,按照上揭的原则,花了一週的潜心钻研,终于整理出了最新的研究成果。《牛津英语词典》,这个简称为 OED的英语词彙终极宝库,究竟一共收录了多少源自中文的词语?我的答案是,500 个左右。

说「左右」,是因为有一些我主观判断的成分,有一些我对衍生词和複合词的取捨,甚至我可能遗漏了部分词语。

我对这个词表的整体印象是,500 个左右的词语中,大部分既冷僻又专业,反映了 OED 这个旷世巨着长久以来的体质。OED 于 1857 年正式启动,迄今百余年,是个早年英国文人醉心其中的计画,内容以「高大上」着称,近来虽调整了方向,儘量反映英语的全貌,试图贴近庶民的生活,不过高大上的体质依旧。

*高大上:中国流行语,全称「高端、大气、上档次」。

按类别来看,在来自中文的 500 个左右词语里,依数量多寡排列:

【世界公民】牛津词典收了几个中文词?

哲学宗教 20 个左右、地方20 个左右、棋艺游戏 15 个左右、历史 15 个左右、情感表达 15 个左右、各色人等 15 个左右、音乐戏曲 15 个左右、朝代 15 个左右、商业货币 15 个左右、社会黑暗面 15 个左右、中医中药 10 个左右、布料服饰 10 个左右、植物 10 个左右、动物 10 个左右、武术健身 10 个左右,建筑、度量衡、书法、自然物质 4 项均不足 10 个。

这是先有结果再行分门别类的,分类时也常碰到一些两难的情况。比如地名,OED 收录的地名几乎都不是单纯的地名,而是作为修饰语,用以表该地的历史、语言、特产、风格等,因此在定其归属时仅能择一而为,有时单纯,有时只得武断。

这个 500 词表的体量偏大,本文难以容纳,将于下一期完整刊出,敬请期待。