他途。”
然而,接下来的问题就是:这些耗资甚巨的古籍训练[注: 训练 training 为了胜任指定的工作和完成分配给系统的任务所要求学习的程度。(防务采办术语-98)-xunlian]样本从何而来?也正是这点,让古籍识别技术的推进举步维艰。
“现在,社会上对古籍数字化产品需求量本就不多,生产相关产品的企业更加稀少,几乎没有企业找我们合作,单靠市场这条路根本行不通。”丁晓青对记者说。
更让她无法释怀的是,“近10年间[注: 年间niánjiān 解释 【time】 指某个时期或年代里老年间清朝康熙年间 相关词条 年轮 年月 年光 年关-nianjian],古籍识别技术研究项目从国家一些重大规划中渐渐淡出了。现在,识别技术研究无法得到国家政策和资金上的支持。系统无法接触更多的古籍训练样本,要想提高识别能力根本无从谈起。”彭良瑞副研究员递给记者一份研究报告说:“与之形成对照的是,欧美对拉丁体系文字的古籍数字化研究却方兴未艾。近年来,欧盟26家图书馆联合推出IMPACT(Improving Access to Text)项目,旨在通过OCR(光学字符识别)等技术的研究,来推动15-19世纪英文等拉丁体系文字的古籍全文数字化工程。”
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>