| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

溫哥華資訊

溫哥華地產

溫哥華教育

溫哥華財稅

新移民/招聘

黃頁/二手

旅游

中國論文工廠,已經用AI批量生產垃圾論文了?

QR Code
請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
Scientific Reports的副主編、英國薩裡大學數據科學家馬特·斯皮克(Matt Spick)注意到,一批垃圾論文正以每天一篇甚至兩篇的速度,在迅速湧入他工作的期刊。


它們選題各異,套路卻驚人地一致。有的研究血清維生素D與抑郁症的關系,有的分析碘攝入與糖尿病,有的考察炎症指數與睡眠質量,總之就是考察一個變量對一種疾病的影響。只需一份標准化的數據集、一段回歸模型腳本,再得出一個統計顯著的結果,這類論文就能迅速成文。換個變量,又是新的一篇。

這種沒有信息含量的垃圾論文數量在迅速膨脹。2024年,僅1月至10月,全球就發表了190篇這類基於美國 NHANES 健康數據庫的“單因子關聯研究”,幾乎是2014至2021年間年均發表數量的五十倍。


01

國產垃圾論文攻陷國外期刊

更引人注意的是,垃圾論文數量的激增幾乎完全集中在中國。2021至2024年間,全球共發表了316篇此類論文,其中有292篇的第一作者來自中國單位,占比超過92%。而在2014至2020年的25篇中,這一數字僅為2篇[1]。

這組數據來自於斯皮克和他合作者今年發布的一項研究。為了系統性地研究這一現象,斯派克和他的合作者在PubMed和Scopus等學術數據庫中,使用精確的關鍵詞組合進行檢索,篩選出過去十年間所有使用NHANES數據、且研究設計為單因素關聯的論文。經過篩選,他們最終確定了341篇符合條件的論文作為分析對象。

這些論文大多采用相同的方法框架:使用 logistic 回歸模型,研究一個健康變量與一種疾病或生理狀態之間的統計關聯,最多控制三五個協變量,結論集中在“顯著相關”這一層面。研究的問題不同,結構幾乎不變。

在對這三百多篇論文進行分析後,研究團隊發現,它們普遍遵循一套高度重復的寫作腳本。研究者從數據庫中選取一個預測變量,比如某種維生素水平,再選擇一個健康結果,比如抑郁症,通過標准化的統計流程將兩者建立關聯,最終得出一個簡單的結論,A 與 B 相關。在最極端的情況下,研究者甚至只需顛倒自變量和因變量的位置,就能生成另一篇論文,無需任何生理學依據或理論假設,便可無限擴展變量與結局的組合方式。


為了進一步說明這類研究存在的問題,研究團隊使用了網絡分析方法,把所有論文中提到的預測變量和疾病之間的配對關系畫成圖表。結果顯示,像抑郁症這樣的復雜疾病,被幾十個毫無關聯的變量分別單獨研究過一次。圖中呈現出一種“一個變量對應一個疾病”的稀疏結構,揭示出這類研究往往忽視疾病背後的多重因素,只是簡單地找出某種單一因素與某個結果之間的聯系。

團隊以抑郁症為例,檢驗這些論文是否可靠。他們統計了所有聲稱與抑郁症顯著相關的研究,一共28篇,並使用一種叫“錯誤發現率”(FDR)的統計方法,對這些結果重新進行了校正。FDR 用來處理多個變量同時檢驗時容易出現的假陽性問題。結果發現,這28項中有15項在校正後不再顯著,說明很多看起來有效的結果,其實可能只是偶然波動造成的。

研究人員進一步發現,不少論文在數據使用上存在操縱的嫌疑。NHANES 是一項跨年滾動調查,覆蓋數十年的連續數據,供研究者完整調用。但在大部分論文中,作者卻在沒有提供任何解釋的情況下,僅選取了其中一小段年份區間進行分析。這種精心挑選數據的做法,很難不令人懷疑其動機是為了篩選出p值最低、結果最漂亮的組合來發表。


將所有線索串聯起來,一條AI論文流水線已經顯示地非常清晰了。一個對AI開放的數據庫作為原料,輔以自動化的分析腳本,再套用高度公式化的研究設計,最終得以在短期內以指數級速度產出大量雷同的論文。這套流程完美地契合了AI輔助的工作模式,正如報告作者所言,這種生產力的提升,對“旨在通過提供低質量或偽造稿件來牟利的論文工廠尤其具有吸引力” 。

02

論文工廠用上AI了

這一切的起點,是龐大的公共健康數據庫NHANES。這是由美國官方主導的一項長期項目,旨在評估美國成人和兒童健康與營養狀況。該調查每兩年進行一次,招募約1萬名參與者,通過結合訪談、體格檢查和實驗室檢測,收集了涵蓋疾病、風險因素、營養指標等超過700個變量的綜合數據。

造成這一局面的部分原因,在於NHANES 本身高度結構化的數據形式。它的數據可以通過API直接導入Python或R語言環境,一系列標准庫(如 nhanesA、pynhanes、NHANES pyTOOL 等)支持自動搜索、清洗、建模與輸出。過去需要團隊手動完成的數據整理和圖表繪制,如今可在更短時間內借助腳本工具實現。
不錯的新聞,我要點贊     無評論不新聞,發表一下您的意見吧
上一頁12下一頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0338 秒 and 7 DB Queries in 0.0034 秒