用户名: 密码:
会员中心 在线投稿
| 网站首页 | 中国历史 | 世界历史 | 历史名人 | 教案试题 | 历史故事 | 考古发现 | 历史图片 | 文化 |
相关文章    
您现在的位置: 历史千年 >> 文化 >> 国学文化 >> 正文
破茧成蝶:古籍数字化的…
最新热门    
 
破茧成蝶:古籍数字化的窘境与生机(2)

时间:2011-12-19 21:02:17  来源:不详
古籍整理犹如积薪,后来居上,一代又一代学者无不是站在前人的肩上,向着理想中的最佳版本一步又一步迈近。前人遇到的坎,后人学会跨过。前人走错的路,后人不必再走。如果因为整理在先,传统出版便将大批古籍资源垄断在手;如果因为点校相似,数字出版便被想当然地认定有侵权之嫌;那么古籍的命运就当真堪忧了。 


  中华书局编审刘尚慈不无遗憾地说:“真正的最佳版本存在于当下,就是那些经过专家标点校勘过的本子。我们的古籍最应该数字化这些本子,可惜却受到版权限制,没有办法进行。而真正拥有版权的出版社,却又没有能力进行。”


  高校古委会秘书处副秘书长卢伟希望在互联网上建立一个开放的资源平台,“怎么能够在共享和利益之间找到平衡,让大多数的学者都愿意把自己的成果投入进来”,是这个平台建立的关键。


生 机


  一只蝴蝶扇动翅膀,不久的将来会在遥远的[注: 《遥远的》-歌曲 遥远的地方 歌手 梦之旅[ti:遥远的地方][ar:梦之旅演唱组合][al:流淌的歌声]——遥远的地方——梦之旅演唱组合在遥远的地方那里云雾在荡漾微风轻轻吹来掀起一片麦浪在亲爱的故乡]彼岸掀起一场飓风。


  古籍数字化发展至今,坐拥海量古籍资源,除了全文检索、联机字典、图文对照、繁简转换之外,数字化究竟还能做些什么?


  本届会议为这个问题带来了几种可能的答案。


  (一)版本比对与辅助标点——人力有尽,天道无穷


  人类智慧无敌,机器效率无敌,人机合一,所向披靡。这正是古籍数字化孜孜以求的理想境界,虽然目前尚无法达到,却依然不乏希望。会上首都师范大学电子文献研究所演示的古籍智能版本比对和辅助标点系统,便让人眼前一亮。


  所谓智能版本比对,指能自动进行多种版本的逐字比对,完成后即可标示出文字和符号的任何差异。所谓智能辅助标点,则使用了前沿的人工智能算法和多种资源库,理想状态下自动标点准确率在99.5%以上,机器无法完全识别的情形下会自动提示专家进行人工干预。“单凭肉眼,很难分辨文字上的一些细微差异。”尹小林说,“如‘礻’和‘衤’、‘曰’和‘日’等,即使底本就在眼前,只怕也会误认,但对于电脑而言,却是完全不同的两个编码,识别起来绝无含糊。其实,比对的目的还是为了查错,在这方面,电脑的优势远非人眼所能比拟。”


  新闻出版总署规定图书出版质量标准为差错率不得超过万分之一。换作从前,这个标准很难得到彻底执行,但现在却是轻而易举。电子文献研究所曾用智能版本比对系统抽查了部分古籍图书,发现即便是权威出版社出版的权威版本,也有不合格者,更遑论其他普通版本。这一比对方法若能在今后的古籍校勘中加以效仿,相信定会从整体上提升古籍的出版质量。


  除了自动校勘,自动标点同样是古籍整理工作者梦寐以求之事。而智能辅助标点系统的出现,让这个梦想变得唾手可得,尽管还不完美,却足以令人惊喜。借助该系统,不仅免除了许多无谓的重复劳动,还可以把节省下来的时间投入到更重要的研究中去,这无异于延长了学者的生命。为此,电子文献研究所于年初启动了文渊阁[注: 文渊阁,清宫藏书楼,乾

[1] [2] 下一页

 
  | 设为首页 | 加入收藏 | 联系我们 | 友情链接 | 版权申明 |  
Copyright 2006-2011 © www.lsqn.cn   All rights reserved
历史千年 版权所有