jjzjj

突破100万用户!华人本科生最强AI检测器GPTZero:美国宪法是AI写的

新智元 2023-03-28 原文
ChatGPT的爆火,不仅让众多学生有了作弊利器,也让一众自己写论文的清白好学生,无故蒙冤!

要说起原因,不由让人深感荒谬——都是因为那些为了「用魔法打败魔法」而造出的各种AI检测器。

实测不可靠,美国宪法竟出自AI之手?

众多AI检测器中,最出名的一个便是由普林斯顿华人本科生Edward Tian创建的GPTZero——它不仅免费,而且效果拔群。

我们只需把文字复制粘贴进去,GPTZero就可以明确地指出一段文字中,哪段是AI生成的,哪段是人类写的。

原理上,GPTZero主要靠「困惑度」(文本的随机性)和「突发性」(困惑度的变化)作为指标进行判断。在每次测试中,GPTZero还会挑选出困惑度最高的那个句子,也就是最像人话的句子。

然而这个方法其实并不完全可靠。

最近,有好奇的网友就用「美国宪法」做了一个实验,而结果更是让人大跌眼镜——

GPTZero表示,美国宪法是AI生成的!

无独有偶,有越来越多的学生发现,自己辛辛苦苦写的论文,也会被检测器判定为AI生成的。

AI说你是用AI写的 ,你就是用AI写的!

前两天,Reddit上就有一位12年级学生向大家求助说,老师用GPTzero检测之后,坚信论文中的部分内容就是由AI生成的。

「我一直是个成绩优异的学生,我不知道为什么我的老师会认为我作弊。我把一切都告诉了我的老师,但他还是不相信我。」

对此老师解释称,使用grammarly(一款在线语法纠正和校对工具)没问题,但GPTzero给出的结果已经非常明确——你就是用了ChatGPT。

绝望的学生表示,自己会提供所有可能的证据,来证明这个所谓的人工智能探测器是错的。

对此,有网友表示完全无法理解老师的做法:「什么叫AI说你作弊,你就是作弊,证据何在?」

另一位网友则给出了更加实用的建议:把ChatGPT出现之前的文章丢进去看看结果如何。(类似于之前的那个「美国宪法」实验)

此外,还可以用OpenAI的官方声明来为自己辩护:「我们真的不建议孤立地使用这个工具,因为我们知道它可能出错,就像使用人工智能进行任何种类的评估一样」。

还有网友分析称,作业论文在结构上通常都有着较为严格的要求,而ChatGPT在训练中又进行了大量的学习。

结果就是,AI生成的内容看起来都是标准的五段式论文。

因此,学生的作业从一开始,就注定了会和ChatGPT生成的文本非常相似。

GPTzero虽然声称假阳性率<2%,但这个数据(即使是真的)更多的是基于对新闻类内容的评判。

所以该网友认为,我们对GPTzero,或OpenAI的分类器,或任何声称能够可靠地区分人类和AI的工具,都应该抱有怀疑的态度。

ChatGPT暴露了论文设定上的缺陷

AI的出现,让作弊的学生提供的巨大的便利,却也让不作弊的学生,深陷无尽的麻烦。

那么,让我们干脆回归问题的本质,在学校教育中,到底该不该允许学生使用ChatGPT呢?

近日,作家Colm O'Shea在文章《感谢ChatGPT揭露本科论文的平庸》中表示,本科的论文重点是教育,而不是知识的进步。这其中最关键的是,在写作过程中,是要训练和展示你有目的地处理信息的能力,而不是让你做一个有价值的知识产出。有价值的产出是由训练有素的合格劳动力负责的。

一般来说,文章起源于古希腊和罗马作家的学术文本,或早期基督教会教父的书信,但其实现代文章的形式起源于蒙田。

这位富有而博学的16世纪法国哲学家,在人生中的某个时刻,忽然对自己庞大的图书馆感到怀疑:「如果我以为自己所知道的一切,其实都是扯淡的,怎么办?」

于是,他开始做这件事——写随笔,这个行为具有深远的意义:让他重新看待世界。

他起的标题千奇百怪,比如「拇指」「畸形儿童」「食人族」,展现出他广泛而奇特的精神领域。他的每篇文章都围绕一个观点,并从各个角度进行审视,来找到新的见解,仿佛这些角度是由另一个意识撰写的一样。

录取之后,一部分学生又会去恳求教授,给他们提供一个正确的模板来模仿,亦或者,他们会找抄袭或论文代笔去走捷径,走向他们想象中的未来。

就好像到了大学以后,学习和思考就再也不用写作来辅助了一样。

不过,这是在ChatGPT火起来之前。现在有了ChatGPT,论文剽窃和代写的乱象已经蔚然成风。虽然说这些现象并不能只怪AI,但已经足以说明大学教育中的问题。

症结在哪里?

这场危机,其实源于大学本科教育中一个更巨大、更古老的问题。

长期以来,人们过分关注收敛思维——换句话说,对于有固定解决方案的问题,去测试学生能否获得问题的「正确」答案。

大学申请的测试通常注重两大类:知识基础和认知能力。标准化的测试能够检测学生对学科掌握程度,但这忽略了另一个重要的领域:发散性思维。

而发散性思维,正是创造性工作的前提。

而且,发散性思维是与标准化背道而驰的。发散思维靠的是深度模式识别和类比(口头、视觉、数学)等机制,而要让ChatGPT从令人眼花缭乱的大数据集中收集「要点」,这并不是它们擅长的。

这种思维可以用一个词形容,那就是「机智」(这种机智是一种令人惊讶的灵感,能够把两个不相干的事物进行融合,或者联系起来),虽然听起来有些玄乎,但这种能力非常重要。

认知科学家、类比思维权威专家Dedre Gentner解释说,生动地向自己或他人解释某事可以培养抽象能力,还可以发现不同领域之间的新联系。

对于Gentner来说,相比于看一个人的智商,他进行准确隐喻或类比的能力,更能体现自己的创造性。因为科学的突破,往往就是通过那「惊鸿一瞥」,让人们发现了两个不同事物之间的类比,这种类比充满想象。

同样的,威廉玛丽学院的创意和创新教授K.H Kim认为,亚洲和西方教育体系对趋同思维的痴迷关注,正在减缓整个艺术和科学的创新。

理想状态下,大学论文是要作者玩一个智力游戏,过程中的各种障碍会绊倒他们,让他们意识到自己对于学科的了解只是冰山一角。应对挑战时,游戏的「音效」会提醒他们保持头脑清醒,意识到自己可能犯了错。

然而ChatGPT展示的是最为糟糕的情况:在一个回音室中,对于批判性共识进行了一个优雅齐整的总结。

胡说八道大师

还记得Harry Frankfurt的那篇哲学文章《论胡说八道》(On Bullshit)吗?他在文章中提到了两个概念:撒谎(虚假)和滔滔不绝地提出令人信服却没有经过仔细考虑的主张(胡诌)。

撒谎的人需要一个准确的真相模型来主动向他人隐瞒真相,而胡说八道者则不需要这种意识。

事实上,胡说八道的人可以一整天都在说真话;在Frankfurt看来,说他们胡说八道不是因为他们话语的真假,而是他们随心所欲不计后果的说话方式。他写道:「就凭这一点,废话比谎言更能成为真理的敌人」。

ChatGPT就是Frankfurt「胡说八道」艺术流派的巅峰之作。它使用大型语言模型将人类可能对某个主题说的话拼凑在一起,这是一种令人毛骨悚然的理解模拟,但与对现实世界的洞察力完全脱节。

ChatGPT最引人注目的一个特点就是,它惟妙惟肖地模仿了许多学术文章中特有的口若悬河、毫无生气的散文风格。

Stephen Marche在Atlantic上发表的文章《大学论文已死》,在我和同事中引起了许多讨论。他给ChatGPT生成的示例文本打了B+,而他在解释时说:「这段话读起来就像填充物一样,但是大多数学生作文也是如此。」

这句话让我非常忧心,但也很无奈。

早在ChatGPT之前,废话文学就一直困扰着我们,但我们难道就要顺其自然,任其发展了吗?

虽然听起来像是无可救药的理想主义,但是我要奋起说不!

一个有责任心的学者,应该让文章回归到它应有的蒙田式传统:对各种可能性进行不同的、创造性的发散探索。

这需要进行一些改革,比如远离大讲堂,在那里,学生和教授之间的唯一接触点是一篇匆匆写好的、匆匆打分的论文。而如果控制在较小的师生比例,足以恢复学生和老师之间以及学生之间的辩证交流。

AI将不断发展。机器学习将在各种领域产生数以百万计的新颖方案。

目前,AI的发展会有两个极端方向:没有新意的趋同和收敛,以及没有「适当性」意识的极端分歧。

这里借用Dean Keith Simonton对于创造力的定义:原创性x适当性。

「适当性」是特定领域的一套庞大的维特根斯坦式的「语言游戏」,其深度和广度只会随着我们的文化变得更加复杂而增加。这套深层次的「游戏」过于微妙,它是非理性的,而且变化迅速,AI无法仅通过挖掘我们的文本来掌握。

在一个理想的未来,教育可能会优先培养所有年龄段的学生在所有学习领域的好奇心、创造力和敏感性。这个项目令人振奋,不过有些迟了。

这并不意味着如果我们比不过AI,就放弃获取知识了,它需要我们重新开始「玩」我们的想法,以及围绕我们如何学习、为什么学习进行元认知的实践。

对于有情感的众生来说,最终极游戏是当他们被邀请按照自己的条件提出问题时,他们的答案会让自己都感到惊讶,他们会发现自己的答案是多么有启发性。

人类自身的神奇思维可是比AI的模仿理解力要好得多。

在文末,小编想说,Colm O'Shea的这篇文章,真的是让我们爱惨了。

经常有读者留言问我们的文章是不是ChatGPT写的,这里可以借用这篇文章的观点来回答:如果你能感受到文章中「惊鸿一瞥」的那一瞬间,这种创作一定是来自人类,而不是AI。

有关突破100万用户!华人本科生最强AI检测器GPTZero:美国宪法是AI写的的更多相关文章

  1. 100个python算法超详细讲解:画直线 - 2

    1.问题描述使用Python的turtle(海龟绘图)模块提供的函数绘制直线。2.问题分析一幅复杂的图形通常都可以由点、直线、三角形、矩形、平行四边形、圆、椭圆和圆弧等基本图形组成。其中的三角形、矩形、平行四边形又可以由直线组成,而直线又是由两个点确定的。我们使用Python的turtle模块所提供的函数来绘制直线。在使用之前我们先介绍一下turtle模块的相关知识点。turtle模块提供面向对象和面向过程两种形式的海龟绘图基本组件。面向对象的接口类如下:1)TurtleScreen类:定义图形窗口作为绘图海龟的运动场。它的构造器需要一个tkinter.Canvas或ScrolledCanva

  2. ruby-on-rails - 计算数组中的项目跨越数千条记录的 100 条 - 2

    我有一个带有Postgres数据库的Rails应用程序,该数据库有一个带有jsonbgenres列的Artists表。有几十万行。该行中的每个流派列都有一个类似["rock","indie","seenlive","alternative","indierock"]的数组,其中包含不同的流派。我想要做的是在所有行中以JSON格式输出每种类型的计数。类似于:{"rock":532,"powermetal":328,"indie":862}有没有办法有效地做到这一点?更新...这是我目前得到的...genres=Artist.all.pluck(:genres).flatten.delet

  3. 最强Http缓存策略之强缓存和协商缓存的详解与应用实例 - 2

    HTTP缓存是指浏览器或者代理服务器将已经请求过的资源保存到本地,以便下次请求时能够直接从缓存中获取资源,从而减少网络请求次数,提高网页的加载速度和用户体验。缓存分为强缓存和协商缓存两种模式。一.强缓存强缓存是指浏览器直接从本地缓存中获取资源,而不需要向web服务器发出网络请求。这是因为浏览器在第一次请求资源时,服务器会在响应头中添加相关缓存的响应头,以表明该资源的缓存策略。常见的强缓存响应头如下所述:Cache-ControlCache-Control响应头是用于控制强制缓存和协商缓存的缓存策略。该响应头中的指令如下:max-age:指定该资源在本地缓存的最长有效时间,以秒为单位。例如:Ca

  4. 未来的趋势————以ChatGPT为标杆的AI对生活的影响是巨大的 - 2

    文章目录前言1.AI的发展历程2.我是如何接触到人工智能的概念和产品的3.对于ChatGPT的一点看法4.AI对大学毕业生的职业发展的利与弊5.对于AI的思考和问题前言随着ChatGPT的爆火,生成式AI,大模型的人工智能被越来越多的人注意到,同时他也带来了许多问题。本文将对几方面进行探讨。1.AI的发展历程远古时期在公元前第一个千禧年,中国,印度和希腊哲学家都提出了一些推理的研究理论,比如亚里士多德(Aristotle)进行了演绎推理三段论的完整分析,欧几里得(Euclid)所著Elements是一种形式推理的模型,MuḥammadibnMūsāal-Khwārizmī,发明了代数学,即我们

  5. 焕新古文化传承之路,AI为古彝文识别赋能 - 2

    目录1古彝文与古典保护2古文识别的挑战2.1西文与汉文OCR2.2古彝文识别难点3合合信息:古彝文保护新思路3.1图像矫正3.2图像增强3.3语义理解3.4工程技巧4总结1古彝文与古典保护彝文指的是云南、贵州、四川等地的彝族人使用的文字,区别于现代意义上的彝文,古彝文指的是在民间流通使用的原生态彝文,多达87046字。古彝文的起源距今至少数千年,是世界上最古老的文字之一。对古彝文字集研究有助于理解尚未被翻译成汉文、用字尚未规范化的古籍,更深层、透彻地作用于传统文化保护。古彝文字义对照图(网络资料+邵文苑供图)古籍是不可再生的宝贵资源,应当得到妥善保护。中国的古籍在历史上迭经水火兵燹等自然灾害、

  6. ruby - `-' :String 的未定义方法 "100" - 2

    这段Ruby代码:income="100"bills="52"putsincome-bills抛出一个错误:./to_f.rb:6:undefinedmethod`-'for"100":String(NoMethodError)在对字符串执行数学运算时,Ruby不会自动将字符串转换为数字吗? 最佳答案 Ruby是一个dynamically-typed,strictly-typed(或“强类型”)语言。Lua是另一种这样的语言。前者意味着变量可以包含任何类别的值。后者——你遇到的情况——意味着类型强制不会自动发生。将它们与动态类型和松

  7. ruby - 什么是最像 Ruby 的生成 3 个正整数加起来等于 100 的唯一组合的方法 - 2

    条件:a+b+c=100a,b,cpositiveintegersor0期望的输出:[[0,0,100],[0,1,99],...#allotherpermutations[99,1,0],[100,0,0]] 最佳答案 我会写:(0..100).flat_map{|x|(0..100-x).map{|y|[x,y,100-x-y]}}#=>[[0,0,100],[0,1,99]],...,[99,1,0],[100,0,0]]站点注释1:这是一个经典示例,其中列表推导式大放异彩(如果某处有条件则更是如此)。由于Ruby没有LC,我

  8. ruby - 解析 100mb JSON 负载的有效方法 - 2

    我每12小时在我的亚马逊EC2微型实例上运行一次cron作业。它下载118MB的文件并使用json库解析它。这当然会使实例内存不足。我的实例有416MB的可用内存,但随后我运行脚本,它下降到6MB,然后被操作系统杀死。我想知道我在这里有什么选择?是否可以通过Ruby有效地解析它,或者我是否必须下降到像C这样的低级东西?我可以获得一个功能更强大的亚马逊实例,但我真的很想知道是否可以通过Ruby做到这一点。更新:我看过yajl。它可以在解析时为您提供json对象,但问题是,如果您的JSON文件仅包含1个根对象,那么它将被迫解析所有文件。我的JSON看起来像这样:--Root-Obj1-Ob

  9. 【华为OD机试真题 java、python、c++】荒地电站建设【2022 Q4 100分】(100%通过+复盘思路) - 2

    代码请进行一定修改后使用,本代码保证100%通过率,本题目提供了java、python、c++三种代码。复盘思路在文章的最后题目描述祖国西北部有一片大片荒地,其中零星的分布着一些湖泊,保护区,矿区;整体上常年光照良好,但是也有一些地区光照不太好。某电力公司希望在这里建设多个光伏电站,生产清洁能源对每平方公里的土地进行了发电评估,其中不能建设的区域发电量为0kw,可以发电的区域根据光照,地形等给出了每平方公里年发电量x千瓦。我们希望能够找到其中集中的矩形区域建设电站,能够获得良好的收益。输入描述第一行输入为调研的地区长,宽,以及准备建设的电站【长宽相等,为正方形】的边长最低要求的发电量之后每行为

  10. ruby - 数组中的 1 到 100 个奇数 - 2

    在Ruby中有什么很酷的方法可以创建一个1到100的数组,其中只有奇数项(1、3等)。我现在有一个循环,但这显然不是一个很酷的方法!有什么建议吗?我当前的代码:defcreate_1_to_100_odd_arrayarray=[1]i=3whilei提前致谢 最佳答案 Range类为此目的提供了一个非常酷的功能:1.9.3-p286:005>(1..10).step(2).to_a=>[1,3,5,7,9] 关于ruby-数组中的1到100个奇数,我们在StackOverflow上找到

随机推荐