而现在,谭景春也承认,再投入如此的人力、物力和时间成本去进行大量的阅读和摘录几乎是不可能的,因为现代汉语的文本已经极为丰富。好在,有了计算机技术[注: 不论何种文化,技术都是异曲同工的词汇。它可以指物质,如机器、硬件或器皿,但它也可以包含更广的架构,如系统、组织方法和技巧。]的帮助。如今,中国社科院语言所新词收集课题组的计算机程序24小时不间断地在互联网上检索新词汇。工作人员把‘现汉’已经收录的词汇输入这个程序中,这样,凡是‘现汉’没有的词汇在互联网上出现,程序都会自动列出来。“不过这个检索的范围非常宽,包括一些专有名词、地名、人名等。所以我们得到这个检索后会进行人[注: 1.路上行走的人。2.参加同业商行的商人。3、《周礼》“秋官”之属有大行人,掌管接待宾客之礼仪;又有小行人,职位稍低。-xingren]为干预,首先选出其中检索到的出现频率较高的词,然后过滤出适合收入现汉的作为修订词典的后备。”谭景春介绍道。
计算机技术为语料的丰富打下了坚实的基础。另外,语言所也在努力建设自己的古代和现代汉语语料库,谭景春说:“之前提到的一百多万张卡片已经有数字版本,而网络也给我们搜集新词的资料提供了更快捷的平台,遇到新词汇后我们也会通过主流媒体的网站进行搜索,看词汇的使用频率如何,以及上下文和实际词义。在‘现汉’的修订过程中,搜集语料是综合几种方法的工作。”
不过,谭景春也指出,语料库是必须的,但也不能完全依赖语料库。“由于现代汉语发展的需求,语料库不能完全满足词典编写的需求。需要有语言学修养比较高的人对语料进行辨别,材料和人的专业智慧进行互动,才能有好的效果。”
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>