中國文獻查重檢測系統

多語種 圖文 指定高校抄襲檢測系統

正確看待知網期刊查重系統AMLC檢測結果

2019-10-10 閱讀(130)

摘要:本文總結了影響“文王期刊檢查系統”測試結果的因素,并利用系統檢測到的不同文本復制比率,分析了一審文章的學術不端行為。結合實際測試用例,可以得出結論,該系統可以有效地幫助初步審查,但它不能取代初步審查的結論。

正確看待知網期刊查重系統AMLC檢測結果

關鍵詞:HowNet期刊檢查系統; AMLC;檢測結果

近年來,學術不端問題日益嚴重,學術誠信問題受到政府和管理層的高度重視。截至2009年3月15日,教育部長周濟在學術氛圍建設會議上強調了對學術不端行為的“零容忍”。浙江大學何海波學術不端行為相關人員收到中國大學和研究機構對類似紙質欺詐的最嚴厲處罰。

作為科技論文的第一道防線,科技期刊編輯部對初步審查的質量進行了很好的篩選,尤其是抄襲等散文,這也引起了編輯的廣泛討論。王淑華 2001年,提出了使用中國期刊網絡進行初步審查的方法。隨著網絡技術的快速發展,近年來,編輯部門在初步審查中采用了類似的在線審查方法;但是,當文章數量成為評估學術成就的重要標準之一時,提交的數量已大大增加,數據庫已經手工編制。搜索量大大增加,很難找到復雜的學術不端行為,如多源抄襲。 “MinNet期刊檢查系統”(AMLC)的推出無疑為這項工作帶來了極大的便利。許多編輯部門開始使用該系統協助編輯對稿件進行初步審查。志旺期刊檢查系統是3年后中國知網(CNKI)的研發成果。它使用《中國學術文獻網絡出版總庫》作為全文比較數據庫,可以檢測抄襲和抄襲,偽造,偽造,不正確的簽名和多次提交。不端行為,并支持每個雜志的自建比較庫。識別學術不端行為是一個嚴重的問題。它涉及舉報人,舉報人和研究基金資助單位的榮譽和利益。因此,識別不當行為需要建立標準化程序,并需要得到保證。程序的公平性。 2009年,一些高校引入了AMLC的姐妹版“HowNet期刊檢查系統”,以測試畢業論文引起的爭議,并提醒科技期刊的編輯在使用時正確觀察系統的測試結果。 HowNet期刊檢查系統AMLC。 。

1.影響知網期刊知識系統AMLC測試結果的因素

對AMLC檢查系統AMLC工作流程的分析表明,影響測試結果的因素如下。

1),待測試的文章。

1無論作者是否相同,直接確定具有文本巧合程度的稿件是自我報告,不正確簽名還是抄襲。問題的嚴重性自然是不同的。

2物品的可檢測性。這指的是大多數文章,或大多數公式和圖表,更多的漢字,或更多的外語。由于AM LC不能有效地檢測公式,圖形和外語,可檢測部分的比例不同,檢測結果與實際相似性的接近程度也不同。

3文章格式。盡管系統在實際使用中支持多種格式,例如PDF,caj,doc,txt等,但是發現有時不同格式的相同文章處理結果是不同的。

2),比較數據庫。這是AMLC檢查系統AMLC的基礎和核心。匹配良好的數據庫必須全面,完整且最新。

3),檢測指標。 AMLC的檢查系統AMLC提供各種檢測指標,包括文本復制比率,最大片段長度,頭部重合和尾部重合。最直觀的指標是文本復制比率,也可以算作系統提供的主要測試結果之一。

2.志旺期刊檢查系統的AMLC檢測結果分析以下是在工作中使用AMLC輔助審查時遇到的實際情況的詳細討論。只考慮研究內容已在出版物范圍內發表的手稿。所討論的抄襲嫌疑人不會被抄襲或復制,并承擔提交的承諾。書中的作者承諾,手稿已被其他人正確編入索引,并且該手稿的相關內容從未公布,并已在其他地方投票。考慮到中國的相似性通常被認為是30%的手稿被抄襲,50%的手稿被懷疑是抄襲;因此,將調查具有3Q%至5Q%相似性的手稿。并且,原稿的相似性< 30%很容易直接通過,> 50%的稿件很容易被直接拒絕。然而,實際情況更復雜,僅僅使用測試數據來確定原稿是否是抄襲是不合適的。

2.1如果具有較低文本復制的原稿具有<1的文本復制比率。 30%,甚至標準更嚴格,<25%的稿件可以通過初步審查?

根據第1章的分析,相似性不足以表示比較數據庫中與文本沒有高度一致性的文章。可能的情況如下。

1)它確實是一篇具有原創性的好文章,可以通過初步審查。

2)沒有直接復制其他人的陳述,但沒有創新。例如,文章的內容直接應用于現有的方法,或者是一種意識形態的抄襲,抄襲現象被很好地隱藏起來。對于直接應用類型手稿的簡單,成熟的方法,編輯通常可以根據他們的知識積累找到其中的一些并且可以拒絕它們。3)文章中有更多不可檢測的部分(圖形,表格,公式,外語),這導致測試結果與實際結果之間存在很大差異。如果是抄襲公式或圖表,只要檢測到的文章文本復制比率未顯示綠色頁腳文本復制比率&lt; 5%),那么下載和查看文本重合源的文章也很容易找到。特別是,系統傾向于在公式檢測到重合文本之前的前導段落,繪圖標題或表格標題。編輯也可以根據問題的嚴重程度進行正確的治療。對于通過翻譯抄襲另一種語言文章的手稿,大多數編輯可能無法自助,但他們被迫通過測試。

4)抄襲比較數據庫中的無證文章。可以細分為以下幾種情況。

1通過其他渠道,如其他網絡數據庫,論壇,博客等在互聯網上傳輸的文件。雖然《中國學術文獻網絡出版總庫》自1915年以來包含超過5000萬條數據,但它仍未覆蓋所有傳輸的電子數據。網絡。在這種情況下,需要在百度,谷歌和其他搜索引擎以及其他數據庫(如萬方和維普)中再次搜索。作者,標題,關鍵詞和其他信息要素進行深入調查。

2編輯部的手稿,已經審查或已被接受發表的稿件,甚至是剛剛出版的手稿,將來也將被添加到《中國學術文獻網絡出版總庫》。這要求編輯部門及時更新個人比較庫,以確保盡可能包括未在期刊上發表的文件,尤其是多產作者組的手稿。

3其他未發表的編輯部手稿,特別是在試驗和手稿中。由于不同出版物之間的信息很難分享,許多期刊的出版期長達一年,這使得稿件不止一份手稿甚至多份手稿。

4未在網絡上發布的其他文檔,例如僅包含CD-ROM版本或紙質媒體版本的文檔。這些手稿在第一時間也更難找到。

2.2具有較高文本復制的稿件同樣,應根據具體情況分析文本復制率> 50%或更高的稿件。

1)這確實是一個完全的抄襲,毫無疑問它可以被拒絕。2)重新提交重新提交,并將先前拒絕的文檔添加到比較數據庫中。此時,通過系統給出的兩個版本的手稿的不同版本,結合拒絕的評論,如果新提交未能妥善解決原審查提出的問題,也可以直接拒絕。

3)由同一作者撰寫的繼續研究結果。對于此類手稿,作者認為它不適合直接拒絕,后者分為以下兩種情況。

1分離并發表稿件。僅僅追求手稿的數量可能會導致幾份手稿的信息不足。這時,您可以先聯系作者告知利弊,建議您修改合并,然后再拒絕。決策。

2根據目前中國的研究評估體系,很難說服作者將多篇獨立的論文合并成一篇長篇文章。如果無法合并,則應仔細檢查是否針對每篇文章的具體研究內容說明了手稿:和結論;是否在后續稿件中簡要介紹了前一篇文章的研究內容,不是一大段或復制整篇文章。如果作者未能有針對性地突出每篇文章的創新,則應將作者返回修訂版。

4)與同一作者的論文高度相似。此時,有必要僅結合論文的檢測,或同時,與其他文件類似,進行初步審查決定。

5)摘要文章。由于好的評論文章肯定有反映作者獨特見解的內容,如果測試結果表明稿件完全是一堆簡單的其他人的結果,那么它的價值是值得商榷的。文本復制比率在30%至50%范圍內的手稿可以根據第2.1和22節中的分析進行類似處理,并且不再描述。

2.3文章格式對測試結果的影響在使用中發現盡管AMLC檢查系統AMLC支持多種格式的文章,但實際比較效果可能不同。使用該系統的編輯可能已經成功提交了PDF文檔,但文本太短。由于系統本身的技術問題,上傳原稿的實際失敗是文章格式的一個方面。當作者第一次審閱手稿時,他搜索了中國期刊網絡中的參考文獻,無意中搜索了兩篇不同作者標題的文章,下載了兩篇文章的caj版本并使用了AMLC進行檢測。當我查看重合文本來源列表時,我發現這兩份手稿并沒有相互重疊。然而,測試結果也出乎意料地表明,兩篇文章和他們自己的比較不是100%(文章是64%,另一篇是77%)。以下示例可以更直觀地反映此問題。《航空學報》個人比較庫中的文章(doc格式,作者最終確定)已在線發布在中國期刊上(具體的匹配文件格式未知,錄制的最終版本在發布之前編輯但沒有專業修訂)發現新提交的手稿與兩篇文章有文字重疊;然而,個人比較庫中手稿和手稿之間的文本復制比例為46%,同一篇文章中國期刊網絡中文章的文本復制比例為26%,不同的格式實際上導致了測試結果之間的比例為20%。無論檢測系統有多先進,程序有多好,當它們根據指令以嚴格的方式執行時,它們可能最終得不到正確的結果,因為它們不能獨立思考。

3,結論已知的網絡日志檢查系統AMLC是一個非常智能的系統,可以幫助編輯更快速有效地查看稿件。但是,稿件情況非常復雜,應該認真對待每一份稿件,并對具體情況進行分析,特別是學術性的。識別不當行為是一個敏感問題。因此,在使用HowNet日志檢查系統AMLC的過程中,應該記住它只是一臺機器,并且生成的報告只能用作檢查的參考,不應該替換編輯器。第一次審判中的主觀能動性。當使用AMLC檢查重量系統AMLC時,我們必須注意完善比較庫,以便更好地為我們服務。同時,僅依靠AMLC來檢查重量系統AMLC是不夠的。仍然不足以關注多種檢測方法的組合。 。編輯還應注意積累自己的專業知識,不斷提高識別稿件的能力。

高校知網查詢

相關文章

11选五赚钱方法