其烦,而且还会产生检索结果的遗漏。这时哪些字形可以关联,哪些字形不能关联,就是颇费踌躇的事情。我曾建议异体字的关联应该给使用者一定的自由,以便按自己的需要对系统既有的关联方式作一些移易。
记者:这个问题确实很复杂。有没有一些现成的做法可供我们参考?
杨成凯:就以大型古籍资料库“文渊阁[注: 文渊阁,清宫藏书楼,乾隆四十一年(1776年)建成。乾隆三十八年(1773年)皇帝下诏开设“四库全书馆”,编纂《四库全书》。]四库全书全文检索系统”为例吧。系统有繁简字关联、古今字关联、通假字关联等功能,如果开启繁简字关联功能,那么要它检索一个字时,无论给它的是简体还是繁体,它都会连繁带简一起检索出来,无须我们简体查一次,繁体查一次,十分方便。然而这个功能还不完善,有时给它繁体它给出的检索结果要多于简体,这时若以简体检索结果为据就将漏去一些资料。
异体字的归并和关联情况确实十分复杂,我们平常说的《花草粹编》这部书,文渊阁本有时写作“粹”,有时写作“稡”,“四库检索系统”中互不关联,如果我们从书名“花草粹编”查寻,将找不到这部书。
“投入跟产出不相应,影响[注: 影响(之一)yǐngxiǎng【work in concert with;support
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>