一旦发现抄袭内容,反剽窃软件将毫不留情地揪出来 叶茂林 摄
今年,学位论文中有剽窃内容的研究生将要心慌慌了——华中科技大学、华中师范大学、武汉工程大学等高校的研究生院将启用“学位论文学术不端行为检测系统”,对研究生学位论文进行检测。
为何要研发“学术不端检测系统”?目前学术界的不端行为到了何种程度?近日,记者近距离与反剽窃专家接触,就此进行了探访。
海量信息中揪“小偷”
电脑比人脑更管用
根据2008年国际反剽窃大会给出的定义:凡是会引起原创性误会的均称为剽窃。武汉大学信息管理学院硕士导师沈阳副教授,曾申请和获得等多项反剽窃专利授权,前日,他向记者介绍了我国反剽窃工作的现状。
他说,20世纪90年代后,互联网的普及,包括搜索引擎、文献资源库、翻译软件的大量涌现,导致剽窃现象快速蔓延。过去,论文剽窃多靠人工发现,实际上,编辑难以从互联网的海量信息中找到稿件的剽窃来源,也不可能熟悉相关稿件的细化研究领域,这使得剽窃作品被查出的风险较小。
但借助先进的反剽窃检测工具,情况就不同了。2008年4月,沈阳副教授自主研发了“ROST反剽窃系统”软件,目前已在全国20多所高校院系推广和100多家期刊社使用。该系统多次抽样检测表明,大专院校内,学术抄袭现象严重,从教师到博士、硕士、本科生,抄袭的程度逐步递增。
一次随机检测触目惊心
全文剽窃的论文占了两成
近一年来,沈阳副教授借助反剽窃系统,开展了对学术剽窃现象的专门检测:以一所部属高校的学生和教师自由命题论文为例,783篇论文中,涉嫌抄袭者过半:全文剽窃的论文有161篇,占20.4%;段落剽窃256篇,占33.2%。其中一个院系的30篇博士学位论文中,存在学术不端行为的有4篇,绝大多数论文存在标注不规范的问题,没有一篇论文完全符合规范。
在近期计算机领域的一次大型国际会议征稿过程中,“ROST反剽窃系统”随机检测了6篇论文,其中1篇论文内容就属于全文抄袭,抄袭者仅在标题中增加了一个词汇。
学生自己的看法或许更能说明问题。沈阳副教授的工作小组,对一所重点院校450名本科生进行了“剽窃行为的自我评估”调查,自认为“经常”剽窃的学生占32.84%,“较多”剽窃的学生占46.15%。
“火眼金睛”的反剽窃软件
论文雷同到什么程度构成抄袭?前日,记者体验了“反剽窃系统”操作。“学术不端行为检测系统”的比对数据库,基本覆盖了中文科技学术文献。记者看到,该系统页面左侧,一篇《***现状及对策》的论文正在接受检测,右侧来自比对库的一篇《浅谈我国农业保险的发展问题》马上与之对应,两篇文章内容一致处显示为蓝色,一目了然。诊断结果显示为:文字复制比6%,诊断类型属“轻度句子抄袭”。
据了解,该系统根据重合字符数量与文字复制比,分为轻度句子抄袭、句子抄袭、轻度段落抄袭、段落抄袭、整体抄袭5类。此外,还有针对数据篡改、内容伪造、引用杜撰等方面的多个检测指标。
是否构成剽窃,仍靠专家定论
学位论文学术不端行为检测系统的启动,在学生中引发不小反响,除了叫好声外,还有学生困惑:由于不清楚该系统如何检测,会不会被“误杀”?
华中科大研究生院学位办工作人员介绍,学校引用该系统,只作为初筛工具。对疑似问题论文,系统将自动生成检测报告单。“论文是否合格,最终还要由学位审议委员会专家鉴定。”
华中科大表示,一旦发现研究生学位论文存在不端行为,按其严重程度,学校将视情节严肃处理,直至取消其学位申请资格。
杜绝论文剽窃要从源头遏制
相对于人工筛查,反剽窃系统展现了充分优势,但它在技术上仍有一定的局限,比如对跨语言剽窃行为的检测。在广泛应用这种技术手段之时,人们不禁反思,学术不端行为的深层原因是什么?
华中师范大学教育学院范先佐教授说,过去高校科研经费有限,但还是出了一大批高水平的科研论文;但现在,国家对科研投入的经费大大增多,产出的却是大量东拼西凑、数据不准确的学术垃圾。这种低水平的论文会贻害社会。
他说,造成抄袭、造假等行为的深层原因,与整个学术界的浮躁风气有关:争课题、拿经费、评职称,都与学术成果、论文发表捆在一起。“在这样一个大的环境下,还有多少学者坐得住冷板凳,潜心搞学问?这种环境迫使一些师生做出学术不端的举动。”
范教授说,新技术对遏制学术不端行为有一定作用,但这属于事后控制。关键还是要从源头上着手,要改善评价体系太过硬性与指标化的现状,形成一套科学的人才评价体系。
责编:汪蛟龙
留言要注意语言文明,此间评论仅代表个人看法 查看留言