古籍数字化：风景背后_国学文化

他途。”

然而，接下来的问题就是：这些耗资甚巨的古籍训练[注: 训练 training 为了胜任指定的工作和完成分配给系统的任务所要求学习的程度。(防务采办术语-98)-xunlian]样本从何而来？也正是这点，让古籍识别技术的推进举步维艰。

“现在，社会上对古籍数字化产品需求量本就不多，生产相关产品的企业更加稀少，几乎没有企业找我们合作，单靠市场这条路根本行不通。”丁晓青对记者说。

更让她无法释怀的是，“近10年间[注: 年间niánjiān 解释【time】指某个时期或年代里老年间清朝康熙年间相关词条年轮年月年光年关-nianjian]，古籍识别技术研究项目从国家一些重大规划中渐渐淡出了。现在，识别技术研究无法得到国家政策和资金上的支持。系统无法接触更多的古籍训练样本，要想提高识别能力根本无从谈起。”彭良瑞副研究员递给记者一份研究报告说：“与之形成对照的是，欧美对拉丁体系文字的古籍数字化研究却方兴未艾。近年来，欧盟26家图书馆联合推出IMPACT(Improving Access to Text)项目，旨在通过OCR（光学字符识别）等技术的研究，来推动15-19世纪英文等拉丁体系文字的古籍全文数字化工程。”

上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>

	\| 设为首页 \| 加入收藏 \| 联系我们 \| 友情链接 \| 版权申明 \|
	Copyright 2006-2011 © www.lsqn.cn All rights reserved 历史千年版权所有