常用工具 医生入驻 免费问医生

用魔法打败魔法,南开大学最新成果让AI“识破”AI—新闻—科学网

2025-08-26 03:20:54 来源:鱼龙曼羡网   

吉林:“六一”儿童节应科学理性消费

作者:孙玲玲 来源:中国新闻网 发布时间:2025/8/14 13:10:20 选择字号:小 中 大
用魔法打败魔法,识破南开大学最新成果让AI“识破”AI

 

中新网天津8月14日电(记者 孙玲玲)记者13日从南开大学获悉,用魔近日,法打法南南开大学计算机学院媒体计算实验室取得最新研究成果,败魔不仅从评估的开大科学角度揭示了现有AI检测方法的性能不足,并创新性地提出了“直接差异学习”(Direct Discrepancy Learning,学最新成新闻DDL)优化策略,果让教会AI用“火眼金睛”辨别人机不同,识破实现AI检测性能的用魔巨大突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025(ACM International Conference on Multimedia)接收。法打法南

图为南开大学研究团队提出的败魔DetectAnyLLM检测框架以及MIRAGE基准数据集亮点全析。(南开大学 供图)

  ?开大科学

近日,OpenAI发布新一代人工智能模型GPT-5,学最新成新闻再次引发全球关注。果让随着DeepSeek、识破ChatGPT、通义千问、豆包等AIGC大模型逐渐从“新奇玩具”变成学习、工作中不可或缺的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,造成“AI幻觉”;依赖AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。

据了解,目前AI生成内容检测主要有两种路线,一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种分类标准进行分类。

图为AI生成内容检测示意图。(南开大学 供图)

  ?

多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前也曾有权威媒体报道,《荷塘月色》《流浪地球》等经典作品被某常用论文AI率检测系统检出高AI率。

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。

为此,研究团队提出了DDL方法另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。

“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近十万条人类-AI文本对。

“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。

(原标题:“用魔法打败魔法” 南开大学最新研究成果让AI“识破”AI)

 特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。

希望以上内容对您有帮助。

阅读全文
相关推荐
时尚视频推荐精选问答
养生文章推荐
勇士格林向美国男篮道歉 承认打人事件错在自己

执法队员进行突击检查 6尾中华鲎从餐馆回归大海

勇士格林向美国男篮道歉 承认打人事件错在自己
勇士格林向美国男篮道歉 承认打人事件错在自己发布时间:2016-11-20 12:18 来源:豫都网 我来说说 我要投稿[摘要]北京时间2016年7月19日,在被捕事件逐渐平息之后,勇士球员德拉蒙德-
NINE PERCENT 怎么天天发声明?蔡徐坤粉丝炸了:不要双标好不好

网约车险买哪个保险公司好?网约车保险报价查询平台+在线投保

NINE PERCENT 怎么天天发声明?蔡徐坤粉丝炸了:不要双标好不好
今天,有媒体报道称,近日有一段关于王子异的采访视频在网络上流传,具体的内容是什么,虫子天下暂时没有看到,也不好置评,但是从官方的声明可以看出来,这个视频是严重损害了王子异的利益的。于是,官方发表了严厉
安徽省消保委为“恢复和扩大消费”建言献策

纯一氧化碳气体标准物质:精准校准的理想选择

安徽省消保委为“恢复和扩大消费”建言献策
中国消费者报合肥讯记者陶维)7月18日,安徽省政协召开“恢复和扩大消费”月度专题协商会,安徽省消费者权益保护委员会秘书长吴瑞卿作题为《以提升消费获得感为导向增强消费意愿 恢复扩大消费》的口头发言,从提
中粮集团旗下各上市公司2023年1月2日-1月6日收盘情况

标准重修或引发行业“地震”-

中粮集团旗下各上市公司2023年1月2日-1月6日收盘情况
1月21月31月41月51月6中国食品香港)05062.802.792.742.792.80中粮糖业6007376.946.987.037.036.96中粮科工 30105814.9515.1715.
公牛主帅庆幸拥3巨头 韦德:想尽快搭朗多巴特勒

天下晨間新聞  聯準會減少購債之後,會發生什麼事?|天下雜誌

公牛主帅庆幸拥3巨头 韦德:想尽快搭朗多巴特勒
公牛主帅庆幸拥3巨头 韦德:想尽快搭朗多巴特勒发布时间:2016-11-10 11:33 来源:豫都网 我来说说 我要投稿[摘要]北京时间7月17日,据美媒体报道,在接受采访时,公牛主帅霍伊博格表示,
2020年7月21日中国玻璃综合指数,期货知识

元宇宙概念股狂漲,宏達電單月飆100%,想買先搞懂4件事|天下雜誌

2020年7月21日中国玻璃综合指数,期货知识
2020年7月21日中国玻璃综合指数1110.99点,环比上涨2.59点;中国玻璃售价趋势1145.18点,环比上涨2.67点;中国玻璃信心指数974.22点,环比上涨2.24点。今天玻璃现货市场总体
星夜驰援!他们是泉州抗疫前线最美最帅的天使

玻璃茶具使用哪种玻璃好 使用玻璃茶具泡茶好不好,行业资讯

星夜驰援!他们是泉州抗疫前线最美最帅的天使
闽南网9月15日讯闽南网记者 尤燕姿 通讯员 陈玮铭 何毓慧 黄玲艳)疫情袭来,星夜集结,出征支援。他们奔赴莆田与泉港抗击疫情一线……连日来,泉州卫健系统涌现出了一批又一批
拿下华为85亿订单?这家清华系企业成面板界较好黑马,企业新闻

氢中硼烷气体标准物质:高纯标准,助力精密分析实验

拿下华为85亿订单?这家清华系企业成面板界较好黑马,企业新闻
这几天国内股市疯涨,做面板的维信诺公司几乎涨停,原因是市场传出他们拿下了华为大笔订单,今年、明年合计高达85亿元。不过维信诺公司随后回应称,由于客户要求保密,所以无法回复。去年小米发布了环绕屏手机MI
一块实木地板竟有如此秘密你知道吗?

江海建设集团领导与新疆博尔塔拉蒙古自治州党委副书记、州长会谈

一块实木地板竟有如此秘密你知道吗?
一块实木地板竟有如此秘密你知道吗?实木地板材质常见的可用于制作实木地板的树种有水曲柳、白桦、胡桃木、白栎、红栎、柞木、榉树、枫木、橡木、檀木、柚木等,水曲柳的木纹美观,能够达到比较自然的装饰效果。胡桃
杰昵雅:触手可及你的浪漫爱家

超豪华声优阵容恋爱模拟游戏《Date Everything!》现已上线,开启前所未有的恋爱体验

杰昵雅:触手可及你的浪漫爱家
有人说,相爱的人厮守在一起,连光阴都是美的。在茫茫人海之中,遇到对的人,是一件多么幸福的事情。爱上一个人,是要给她物质上的富足、精神上的满足,还是海誓山盟的诺言、地裂天崩的爱情?“山无棱,