天都有人来找我们,要求授权他们使用‘学术不端行为检测系统’。”中国知网科研诚信管理系统研究中心主任孙雄勇告诉中国青年报记者,“每天大量用户注册申请使用,年初最高峰时,一天注册了6000个用户。”
孙雄勇说,虽然每天都有大量注册,但目前开放授权的,基本都是学术科研领域——机构用户和研究生导师,并且要签保密协议。因为担心一旦开放给个人用户之后,会产生不可预料的后果。
这个“学术不端行为检测系统”,是世界首个用全文文献为比对资源检测抄袭行为的软件系统,由中国学术期刊电子杂志社与同方知网公司联合研发。其耗时3年,2008年12月底研制成功,2009年3月研究生院开始使用。据孙雄勇介绍,到6月底,已有3000家期刊编辑部和360多家高校的研究生院在使用,基本上覆盖了全国重点院校。
虽然用户很多,但基本都是免费使用。因为这样的用户,都是知网的论文供应商。知网的主营业务是数字出版,主要是通过合法渠道收集论文,再把这些论文整合后打包卖出去,但近年收稿质量开始下降,“用户经常投诉论文库中有重复,编辑部也为此头疼。所以要求公司开发一套系统来检测。”孙雄勇说。
该系统的技术核心使用了“自适应多阶指纹特征检测技术”,能够防止抄袭中的一些方法,比如替换一些词句、颠倒顺序、重组段落等等。“指纹”是这篇文章的信息特征,简单的手段改变不了这些特征。每一次检测,待检文章首先按照篇章、段落、句子等层级分层处理,然后创建指纹,而比对资源库中的比对文献,也采取同样技术创建指纹索引,根据其重合处的比例,判断该论文是否存在抄袭行为。目前,这个系统用做比对的资源库,是有6000万条学术文献的数据库及上百亿网页的网络资源库。
反抄袭需求五花八门
目前,上述系统每天增加的用户,主要是企业的科研机构和各类科研院所。从用户反馈看,孙雄勇觉得效果挺好,“基本都是要求增加比对范围。”
“有个知名出版社试用时检测了两部准备出版的书,一部60万字,一部80万字。其中一部检测出,作者大量发表过的文章充斥其间。而编辑约稿时明确要求,不能使用发过的文章。”
“还有来检测公务员出国考察
上一页 [1] [2] [3] [4] 下一页