這一領域論文造假達34%!新工具有望“重創(chuàng)”論文工廠

2023-05-18 18:58:35

“唯論文”的科研環(huán)境助長了學術不正之風,學術垃圾井噴更是讓人瞠目結舌。一方面,出版商正加大力度打擊論文工廠,推出新型論文造假檢測工具;另一方面,改變“不發(fā)表就滅亡”的學術氛圍也成為共同呼吁。

論文造假層出不窮

當神經(jīng)心理學家Bernhard Sabel將他的論文造假檢測器投入使用時,他對發(fā)現(xiàn)的結果感到“震驚”。在篩選了大約5000篇論文后,他估計2020年發(fā)表的神經(jīng)科學論文中多達34%可能涉嫌編造或抄襲;在醫(yī)學領域,這一比例是24%。近日,Sabel和同事在論文預印本平臺medRxiv上發(fā)布了相關報告。這兩個數(shù)字遠高于2022年一項關于論文工廠研究所估計的2%基線。


(資料圖片)

來自德國馬格德堡大學的Sabel——同時也是《恢復性神經(jīng)病學和神經(jīng)科學》的主編——驚呼道“這太難以置信了”,就好像“有人告訴你,你吃的東西有30%是有毒的!”

Sabel的發(fā)現(xiàn)驗證了人們普遍懷疑的事情:期刊上涌現(xiàn)越來越多的來自論文工廠的學術論文。

學術界有專門的論文工廠產(chǎn)業(yè)鏈是眾所周知的事情。論文工廠收取費用,替研究人員將造假的論文提交給對口的期刊,壓縮期刊出版周期以達到快速出版的目的,或出售作者署名。

知名出版商于5月發(fā)布的公告強調(diào)了這一威脅:它關閉了旗下4份期刊,因為發(fā)現(xiàn)這些期刊被論文工廠的文章“嚴重侵蝕”。

上文提及Sabel所使用的論文造假檢測工具依賴于2個指標——使用私人、非機構電子郵件地址的作者,以及列出與醫(yī)院有隸屬關系的作者。然而,這不是一個完美的解決方案,因為誤報率很高。其他論文造假檢測器的開發(fā)人員通常很少透露他們的工具是如何工作的,但他們也面臨著類似的問題。

盡管如此,檢測工具還是帶來了打倒論文工廠的希望,論文工廠大量生產(chǎn)包含部分或全部抄襲或捏造的文本、數(shù)據(jù)和圖像。有些論文甚至通過了那些不嚴謹審稿人的認可。此類論文可能會腐蝕科學文獻、誤導讀者并扭曲系統(tǒng)評價。最近出現(xiàn)的ChatGPT等人工智能工具更是加劇了這種擔憂。

新工具有望甄別假論文

魔高一尺道高一丈。為了反擊,代表120家出版商的國際科學、技術和醫(yī)學出版商協(xié)會(STM)正在領導一項名為Integrity Hub(誠信中心)的工作,以開發(fā)新工具。

STM沒有透露太多有關檢測方法的信息,以避免走漏消息?!斑@是一場軍備競賽,”Integrity Hub的產(chǎn)品總監(jiān)Joris van Rossum說,造假的一個跡象是引用了許多被撤稿的論文,另一個跡象是通過電子郵件發(fā)送的手稿和評論,這些ip地址看起來像合法機構的地址。

20家出版商——包括Elsevier、Springer Nature和Wiley等大型出版商——正在幫助開發(fā)Integrity Hub工具,其中10家出版商預計將使用該組織于4月份推出的論文造假檢測器。STM預計今年還將試行一種單獨的檢測工具,用于檢測一稿多投的現(xiàn)象。

由于項目剛起步,STM尚未生成有關準確性或誤報率的數(shù)據(jù)。但捕捉造假論文數(shù)量越多,誤報的概率也越高。Sabel的工具在假論文的測試樣本中能夠正確標記近90%的欺詐或撤稿論文。然而,在真論文的測試樣本中它將高達44%的真論文標記為假論文。由此可見,結果仍然需要由經(jīng)驗豐富的審稿人來人工確認。

審查可疑論文可能很耗時:2021年,Springer Nature對大約3000篇疑似來自論文工廠的論文進行了發(fā)表后審查,需要多達10名兼職和全職員工。(Springer Nature每年發(fā)表約400000篇論文。)

不過,4月份發(fā)布的最新期刊指南可能有助于減輕工作量。由出版商資助的非營利性出版道德委員會表示,即使證據(jù)是間接的,他們也可以決定拒絕或撤回懷疑由論文工廠生產(chǎn)的論文。在此之前,舊版指南鼓勵期刊向每篇可疑論文的作者詢問更多信息以輔助判斷,但溝通可能會引發(fā)冗長的來回爭論。

論文工廠或可內(nèi)外兼攻

打擊論文工廠的兩條路——疏與堵。從內(nèi)部而言,要疏,即消除科研工作者盲目追求論文的信念;從外部而言,要堵,即聯(lián)合出版商以及期刊集體抵抗。

科研工作者面臨著“不發(fā)表就滅亡”,這個壓力是很大的障礙。Joris van Rossum表示,“我們考慮與機構合作,探討如何取消可能會產(chǎn)生這些不利影響的一些‘專業(yè)’的激勵措施。”Sabel表示,這種壓力會促使沒有時間研究的臨床醫(yī)生轉向論文工廠。

Byrne表示,出版商應該尋求外界的幫助,以改進支持論文造假檢測工具的技術,盡管這需要對其工作方式保持透明?!爱敼ぞ呤情]門造車時,沒有人可以批評或檢驗檢測器的性能”,她補充說,更公開、更廣泛的合作可能會事半功倍,趕在論文工廠反偵察之前攻破。

一些學者表示論文工廠的論文會逐步遷移到影響力較低的期刊,而檢測它們的資源較少。但如果許多期刊聯(lián)合行動,整個論文工廠產(chǎn)業(yè)的生存空間會急劇萎縮。

參與Integrity Hub工具開發(fā)的咨詢顧問Adam Day看到了一些希望:標記論文工廠目標的可疑期刊,可以迅速阻止更多的欺詐性投稿。

用Papermill Alarm自動檢測器進行的一項分析數(shù)據(jù),每列顯示月發(fā)文數(shù)量

由Adam Day擔任創(chuàng)始董事的公司Clear Skies進行了一項分析(如上圖),在一份2020年的報告點名涉嫌包含論文工廠論文的期刊之后,使用Papermill Alarm自動檢測器進行的一項分析發(fā)現(xiàn),其中一份期刊中此類論文的數(shù)量迅速且急劇地下降。

參考資料:

https://www.medrxiv.org/content/10.1101/2023.05.06.23289563v1

https://publicationethics.org/node/55256

https://www.science.org/content/article/fake-scientific-papers-are-alarmingly-common

標簽:

關閉
新聞速遞