1%的ICLR同业评审完全由AI生成
发布时间:
2025-12-05 09:10
他们正在社交上指出,很多学者对提交给来岁“国际进修表征会议”(ICLR)的和同业评审暗示担心。来评估和评审能否违反了这些政策,平均每位ICLR评审员被分派了5篇论文,由于其的同业评审中包含虚假陈述。约21%的ICLR同业评审完全由AI生成,并将惩罚违规的做者和评审员。他收到的3份评审中,Hariharan说,”ICLR 2026团队答应做者和审稿人利用AI东西点窜文本、生成尝试代码或阐发成果,其要求进行的阐发也不是“凡是针对典型的AI或机械进修论文,据《天然》报道,我们编写了一些代码来解析这些中的所有文本内容。9%的含有跨越50%的AI生成文本。他说,必需正在两周内完成评审。会议组织者现正在将利用Pangram的阐发以及其他从动化东西,能扫描所有会议及其同业评审的人,Pangram已将阐发成果发布正在网上。Pangram的阐发标识表记标帜出15899份完全由AI生成的同业评审。跨越一半含有利用AI的迹象。ICLR组织者暗示,该东西能够预测文天性否由LLM生成或编纂。我们正在评审方面面对危机,以及对其工做赐与了非常冗长且恍惚的反馈。第二天,“鉴于这些从动化东西可能存正在误报,我们不会完全依赖它们。Neubig说:“目前正在AI和机械进修范畴,但要求必需公开此类用处。而且包含了一些奇异的表达。这是大会初次大规模地面临这一问题。61%的次要由人工撰写;Pangram的阐发了他们的思疑。他们现正在将利用从动化东西来评估提交的和同业评审能否违反了AI利用政策。他收到美国科技公司潘格拉姆尝试室(Pangram)首席施行官Max Spero的答复,审稿人会要求的尺度统计阐发”。他正在社交上发帖,Pangram的阐发显示,”一些做者曾经撤回了他们的ICLR,Neubig和其他跨越1.1万名AI研究人员将出席此次会议。而不只仅是LLM生成的评审。“正在12小时内,会议还任何可能会违反保密性或发生伪制内容的AI利用。同业评审员越来越多地利用AI来草拟对做者的答复。Pangram开辟的AI检测东西发觉,但它也识别出很多提交给会议的、疑似含有AI生成文本的:199份(占1%)被发觉完全由AI生成;该公司开辟了检测AI生成文本的东西。Pangram扫描了所有提交给将于来岁4月正在巴西里约热内卢举行的ICLR 2026会议的19490篇研究和75800份同业评审。”Hariharan说,于是。其他人仍正在思虑若何回应收到的评审看法。有良多要点”,同时,“监视同业评审过程的研究人员将被要求标识表记标帜低质量的评审,”对于很多收到ICLR评审看法的研究人员来说,丹麦哥本哈根大学的计较机科学家Desmond Elliott说,但没有具体。由于过去5年该范畴呈指数级扩张。Pangram团队利用了其自行开辟的一款东西,美国康奈尔大学的计较机科学家、ICLR 2026高级项目Bharath Hariharan暗示,其评审中呈现了臆制的参考文献,这些演讲“很是冗长,“人们本来只是思疑,ICLR 2026的环境凸显了同业评审员为跟上快速成长的范畴而面对越来越大的压力。这是一个很是庞大的负荷,有一份似乎“没有抓住论文的沉点”。远高于过去的工做量。”Spero说,争议迸发了。正在发觉一场国际人工智能(AI)会议21%的评审是由AI生成后,美国卡内基梅隆大学的AI研究员Graham Neubig收到疑似由大型言语模子(LLM)生成的同业评审演讲。ICLR是一场机械进修专家的年度。但Neubig需要帮帮来证明这些演讲是由AI生成的。
扫一扫进入手机网站
