|
|
|
 |
古籍数字化的步伐有所放缓,呈现瓶颈效应 |
 |
时间:2011-11-10 12:01:59 来源:不详
|
|
|
一种方便快捷、切实可行的整合方式,并建议从数据库类型、建置单位和数据库主题三种途径进行导航设计。
标准如纲,导航如网,纲振网举,方可尽揽群籍。
(二)版权之争——天下公器,安能独私
由于古籍真正的作者皆已作古,无法穿越时空来捍卫自己的原创地位,因此古籍早已作为文化遗产[注: 文化遗产,中文在概念上分为“有形文化遗产”和“无形文化遗产”。“有形文化遗产”即传统意义上的“文化遗产”,根据《保护世界文化和自然遗产公约》 (简称《世界遗产公约》),]被纳入了公共知识的范畴。所谓古籍的版权,实际是针对整理者而言的。
如今常见的古籍绝大多数都已被点校出版,版权握于传统出版社之手。为了避免纠纷,数字出版者们只好舍近求远,返择古本为底本,重起整理之炉灶,可还是难免“抄袭”嫌疑。
古籍整理犹如积薪,后来居上,一代又一代学者无不是站在前人的肩上,向着理想中的最佳版本一步又一步迈近。前人遇到的坎,后人学会跨过。前人走错的路,后人不必再走。如果因为整理在先,传统出版便将大批古籍资源垄断在手;如果因为点校相似,数字出版便被想当然地认定有侵权之嫌;那么古籍的命运就当真堪忧了。
中华书局编审刘尚慈不无遗憾地说:“真正的最佳版本存在于当下,就是那些经过专家标点校勘过的本子。我们的古籍最应该数字化这些本子,可惜却受到版权限制,没有办法进行。而真正拥有版权的出版社,却又没有能力进行。”
高校古委会秘书处副秘书长卢伟希望在互联网上建立一个开放的资源平台,“怎么能够在共享和利益之间找到平衡,让大多数的学者都愿意把自己的成果投入进来”,是这个平台建立的关键。
生 机
一只蝴蝶扇动翅膀,不久的将来会在遥远的[注: 《遥远的》-歌曲 遥远的地方 歌手 梦之旅[ti:遥远的地方][ar:梦之旅演唱组合][al:流淌的歌声]——遥远的地方——梦之旅演唱组合在遥远的地方那里云雾在荡漾微风轻轻吹来掀起一片麦浪在亲爱的故乡]彼岸掀起一场飓风。
古籍数字化发展至今,坐拥海量古籍资源,除了全文检索、联机字典、图文对照、繁简转换之外,数字化究竟还能做些什么?
本届会议为这个问题带来了几种可能的答案。
(一)版本比对与辅助标点——人力有尽,天道无穷
人类智慧无敌,机器效率无敌,人机合一,所向披靡。这正是古籍数字化孜孜以求的理想境界,虽然目前尚无法达到,却依然不乏希望。会上首都师范大学电子文献研究所演示的古籍智能版本比对和辅助标点系统,便让人眼前一亮。
所谓智能版本比对,指能自动进行多种版本的逐字比对,完成后即可标示出文字和符号的任何差异。所谓智能辅助标点,则使用了前沿的人工智能算法和多种资源库,理想状态下自动标点准确率在99.5%以上,机器无法完全识别的情形下会自动提示专家进行人工干预。“单凭肉眼,很难分辨文字上的一些细微差异。”尹小林说,“如‘礻’和‘衤’、‘曰’和‘日’等,即使底本就在眼前,只怕也会误认,但对于电脑而言,却是完全不同的两个编码,识别起来绝无含糊。其实,比对的目的还是为了查错,在这方面,电脑的优势远非人眼所能比拟。”
新闻出版总署规定图书出版质量标准为差错率不得超过万分之一。换作从前,这个标准很难得到上一页 [1] [2] [3] 下一页
|
|
| |
|