点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:AI“参与”同行评审喜忧参半
首页> 数字化频道> 评论观察 > 正文

AI“参与”同行评审喜忧参半

来源:科技日报2025-04-02 16:23

  今年2月,加拿大蒙特利尔大学生态学家蒂莫西·波伊索在审阅自己论文的评审意见时,意外发现其中一份评审报告可能由AI代笔。他对此感到愤怒并在博客中痛斥:我递交论文参与评审,期待的是同行的思想碰撞。若这一前提不再,那么同行评审制度将沦为数字废墟。

  英国《自然》杂志网站在3月27日的报道中指出,AI系统正以惊人速度渗透同行评审体系。多家出版商纷纷测试各种AI审稿系统,用于标记稿件中的文本谬误、数据漏洞,以及对文字进行润色等。一些平台甚至能一键生成完整AI评审报告。一些拥趸认为同行评审自动化不可避免,另外一些科学家则忧心AI未来可能最终主导同行评审过程,弱化甚至完全取代人类审稿人的角色。

  人工智能渗入评审生态

  在ChatGPT等基于大语言模型(LLMs)的生成式AI工具掀起浪潮前,学术出版界已将AI技术引入同行评审环节,用于数据校验、研究结论提炼等辅助工作。但随着具备类人写作能力的生成式AI工具横空出世,这场技术革命也在学术界掀起一场风浪。

  美国威利出版集团针对近5000名研究者的调研显示,约19%的受访者承认尝试过使用AI工具提高评审效率。更令人关注的是,对2023年—2024年AI领域会议论文的评审报告分析发现,7%—17%的评审报告存在由AI工具“深度润色”的迹象,这意味着修改幅度远超基础语法校正范畴。

  当前,很多资助机构和出版商明令禁止评审人员在论文或基金评审中使用AI工具,主要担忧敏感信息经聊天机器人外泄。不过,美国哥本哈根大学科学家塞巴斯蒂安·波斯达姆·曼认为,若使用本地部署的离线AI工具,数据无需上传云端即可处理完成,大大降低了泄密风险。葡萄牙里斯本天主教大学组织行为学研究员德里琼·格鲁达补充道,离线LLMs犹如智能文字助手,能加速并优化评审意见的撰写过程,前提是AI工具仅作帮手而非代写全文。

  尽管使用生成式AI工具日益普遍,但知名期刊仍对其持谨慎观望态度。2024年底针对78种顶级医学期刊AI评审指南的调查显示,59%的期刊完全禁止评审环节使用AI技术。其余期刊允许使用,但提出了不同要求。三大出版集团对AI评审的态度也大不相同。爱思唯尔集团目前禁止审稿人使用生成式AI工具辅助审稿;威利和施普林格·自然集团则允许“有限使用”,但须披露使用细节,并严禁将论文上传至在线平台。

  智能助手纷纷上线

  鉴于主流学术期刊对AI自主评审持审慎态度,科研团队纷纷开发辅助人类评审的生成式AI工具。

  比如,斯坦福大学计算生物学家詹姆斯·周团队打造的“反馈代理”审稿系统,如同文字雕琢大师,能自动识别评审报告中出现的语义模糊等问题,并给审稿人提供相关建议。

  荷兰阿姆斯特丹WBS公司开发的Eliza工具则展现出跨语言处理智能:不仅能向人类评审推荐参考文献,还能将其他语言的评审内容实时翻译成英文。创始人泽杰·卡尔森表示,这就像为审稿人配备了一款多语种秘书,但最终决策权仍在人类手中。据悉,该技术已经帮助《欧洲物理评论》杂志处理了23%的非英语评审内容。

  由英论阁出版集团和查尔斯沃思属公司携手开发的“审议助手”则能快速识别违反匿名规则的论文。不过,该工具也可能产生带有偏见的评审意见,如误认为英语为母语作者的论文更具创新性。

  英国初创公司Grounded AI打造的Veracity系统堪称“打假利器”,可以验证引用文献的真实性,以及文献与文章观点是否相符。此外,它还能标记高重复率段落,防范抄袭风险。该公司联合创始人尼克·莫利描述称,这位不知疲倦的学术侦探,专治文献注水。

  Alchemist review则能快速提炼论文核心发现,评估研究方法的创新性,并验证数据的可重复性。美国物理联合会出版社目前正在旗下两家期刊上试运行该软件。据悉,该系统已经拦截了7篇涉嫌数据造假的投稿。

  由澳大利亚认知神经科学家尚恩·伊尔哈特等人开发的Paper Wizard,能生成多页评审报告,并对论文的方法论进行系统性审查,开发者将其定位为这是一种“预审阶段的智能助手”。

  包括威利出版集团在内的一些出版商也在尝试开发内部AI工具助力同行评审。

  学术批判力不可或缺

  关于AI评审,人们最大的担忧是,其未来会取代人类评审员。

  加拿大非营利学术服务公司OurResearch联合创始人贾森·普瑞姆是AI评审的狂热拥趸,他表示,未来所有论文或都将由AI评审。

  学术传播顾问克里斯·莱昂纳德也预测,尽管目前的AI系统无法完成人类评审员的全部工作,比如精准判断论文的原创性等。但是,随着技术不断精进,AI生成的评审报告的质量将显著优于大多数人类评审。而且至关重要的是,AI的工作效率很高。

  不过,他也强调,就像自动驾驶需要人类监督一样,AI评审必须配备“思想制动系统”。在必要的情况下,启动二次评审。

  包括波伊索在内的一些科学家则认为,AI不具备评审所需的批判性思维,提出的内容大多是“泛泛而谈”。华盛顿大学进化生物学家卡尔·伯格斯特龙也表示,LLMs远不足以写出合格的同行评审报告。写作即思考,如果审稿人将评审工作外包给AI,会导致评审内容流于肤浅。

  波斯达姆·曼则声称,尽管AI确实能对某些评审人的报告进行润色。但LLMs基于训练数据和输入内容生成统计概率上看似合理的文本,其输出几乎总会包含错误。

  英国牛津大学学术伦理研究中心主任艾玛·威尔逊更是警告称:当算法开始评判人类智慧,人们失去的不仅是审稿人的专业判断,更是学术共同体最珍贵的批判性思维。

  如果科学界开始接受AI审查,那么就需要制定强有力的透明度标准,AI审查的每个细节、使用的每个提示词等,都必须予以公开。(科技日报记者 刘霞)

[ 责编:刘昊 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 课本里的抗日英雄 我们从未忘记

  • 中国国际救援队在缅甸曼德勒城区多地持续展开救援

独家策划

推荐阅读
2025年4月1日,北京怀柔慕田峪长城内外山花盛开,美丽的春花把古长城打扮的多姿多娇,犹如春天里一幅壮美的风景画
2025-04-02 15:44
2025年4月1日,船舶航行在安徽省合肥市庐江县境内的引江济淮航道上,标志着菜子湖湿地候鸟越冬季禁航结束,菜(子湖)巢(湖)线恢复通航
2025-04-01 15:40
2025年3月31日,江苏苏州吴中区光福镇,太湖之滨,桃花、樱花、油菜花等竞相绽放,生态优美,春景如画
2025-04-01 15:31
用镜头记录城市更新 青岛首届“百家媒体看改变”活动圆满闭幕
2025-03-20 10:14
"昭君杯"首届全国老年合唱大赛在北京国家大剧院正式启动
2025-03-19 16:10
2025年2月25日,云南省昭通市绥江县,新市金沙江特大桥施工现场,工人正加紧施工。
2025-02-26 15:41
2025年2月7日,重庆市巫山县曲尺乡月明村一大片梅花竞相开放、灿若红霞,游客和市民前来游玩打卡,尽享春日的快乐和惬意
2025-02-08 14:52
2025年2月5日,福建省福清市石竹山风景区,一场非遗英歌舞、建瓯挑幡等非遗表演正在进行,让游客感受中华优秀传统文化魅力,丰富景区文化内涵和游览品质
2025-02-06 15:55
2025年1月20日,江西省赣州市章贡区城市中央公园内,游船与湖水、植被、高楼相互映衬,呈现出一幅冬日多彩美丽生态画卷
2025-01-20 15:30
2025年1月16日,受低温天气影响,山西省运城盐湖出现冬季独特的“硝花”景观,水面上的硝花形态各异晶莹剔透,美不胜收。
2025-01-16 15:56
一位“行者”行走在广袤的沙漠中,遮掩着绝世的面庞,一面“古镜”掩埋于厚重的沙下,刻满了时间的裂痕。
2025-01-13 17:25
2025年1月9日,重庆市酉阳土家族苗族自治县桃花源国家森林公园白雪皑皑,雪景如画
2025-01-09 15:24
关爱卡寒假公益行 助力云南各族青少年儿童梦想起航
2025-01-08 14:42
2025年1月5日,在山西太原南站开往呼和浩特东站的D4022次列车前,游客自拍合影。
2025-01-06 16:01
2024年12月8日,广西梧州岑溪市岑城镇木榔村,生态田园中阡陌纵横线条分明,冬韵如画。
2024-12-10 16:48
2024年12月10日,贵州省黔西市绿化白族彝族乡大海子村,青山环绕树木葱茏,构成一幅美丽的生态画卷。
2024-12-10 16:40
2024年12月6日,古城苏州街头,成片的银杏、红枫等树木色彩斑斓满目缤纷,成为一道迷人的风景。
2024-12-06 15:48
2024年12月6日,初冬时节,山东省青岛市即墨区灵山街道花卉种植基地的大棚里一片繁忙,种植户忙着管护花卉。
2024-12-06 15:48
2024年11月30日,初冬时节,河南省南阳卧龙岗文化园内,树木换上"新装",宛如一幅五彩斑斓的画卷,吸引不少市民、游客前往赏景。
2024-11-30 18:34
民以食为天,一日三餐承载着居民的幸福感。
2024-11-27 18:59
加载更多