突破100万用户！华人本科生最强AI检测器GPTZero：美国宪法是AI写的

新智元 2023-03-28 原文

ChatGPT的爆火，不仅让众多学生有了作弊利器，也让一众自己写论文的清白好学生，无故蒙冤！

要说起原因，不由让人深感荒谬——都是因为那些为了「用魔法打败魔法」而造出的各种AI检测器。

实测不可靠，美国宪法竟出自AI之手？

众多AI检测器中，最出名的一个便是由普林斯顿华人本科生Edward Tian创建的GPTZero——它不仅免费，而且效果拔群。

我们只需把文字复制粘贴进去，GPTZero就可以明确地指出一段文字中，哪段是AI生成的，哪段是人类写的。

原理上，GPTZero主要靠「困惑度」（文本的随机性）和「突发性」（困惑度的变化）作为指标进行判断。在每次测试中，GPTZero还会挑选出困惑度最高的那个句子，也就是最像人话的句子。

然而这个方法其实并不完全可靠。

最近，有好奇的网友就用「美国宪法」做了一个实验，而结果更是让人大跌眼镜——

GPTZero表示，美国宪法是AI生成的！

无独有偶，有越来越多的学生发现，自己辛辛苦苦写的论文，也会被检测器判定为AI生成的。

AI说你是用AI写的，你就是用AI写的！

前两天，Reddit上就有一位12年级学生向大家求助说，老师用GPTzero检测之后，坚信论文中的部分内容就是由AI生成的。

「我一直是个成绩优异的学生，我不知道为什么我的老师会认为我作弊。我把一切都告诉了我的老师，但他还是不相信我。」

对此老师解释称，使用grammarly（一款在线语法纠正和校对工具）没问题，但GPTzero给出的结果已经非常明确——你就是用了ChatGPT。

绝望的学生表示，自己会提供所有可能的证据，来证明这个所谓的人工智能探测器是错的。

对此，有网友表示完全无法理解老师的做法：「什么叫AI说你作弊，你就是作弊，证据何在？」

另一位网友则给出了更加实用的建议：把ChatGPT出现之前的文章丢进去看看结果如何。（类似于之前的那个「美国宪法」实验）

此外，还可以用OpenAI的官方声明来为自己辩护：「我们真的不建议孤立地使用这个工具，因为我们知道它可能出错，就像使用人工智能进行任何种类的评估一样」。

还有网友分析称，作业论文在结构上通常都有着较为严格的要求，而ChatGPT在训练中又进行了大量的学习。

结果就是，AI生成的内容看起来都是标准的五段式论文。

因此，学生的作业从一开始，就注定了会和ChatGPT生成的文本非常相似。

GPTzero虽然声称假阳性率<2%，但这个数据（即使是真的）更多的是基于对新闻类内容的评判。

所以该网友认为，我们对GPTzero，或OpenAI的分类器，或任何声称能够可靠地区分人类和AI的工具，都应该抱有怀疑的态度。

ChatGPT暴露了论文设定上的缺陷

AI的出现，让作弊的学生提供的巨大的便利，却也让不作弊的学生，深陷无尽的麻烦。

那么，让我们干脆回归问题的本质，在学校教育中，到底该不该允许学生使用ChatGPT呢？

近日，作家Colm O'Shea在文章《感谢ChatGPT揭露本科论文的平庸》中表示，本科的论文重点是教育，而不是知识的进步。这其中最关键的是，在写作过程中，是要训练和展示你有目的地处理信息的能力，而不是让你做一个有价值的知识产出。有价值的产出是由训练有素的合格劳动力负责的。

一般来说，文章起源于古希腊和罗马作家的学术文本，或早期基督教会教父的书信，但其实现代文章的形式起源于蒙田。

这位富有而博学的16世纪法国哲学家，在人生中的某个时刻，忽然对自己庞大的图书馆感到怀疑：「如果我以为自己所知道的一切，其实都是扯淡的，怎么办？」

于是，他开始做这件事——写随笔，这个行为具有深远的意义：让他重新看待世界。

他起的标题千奇百怪，比如「拇指」「畸形儿童」「食人族」，展现出他广泛而奇特的精神领域。他的每篇文章都围绕一个观点，并从各个角度进行审视，来找到新的见解，仿佛这些角度是由另一个意识撰写的一样。

录取之后，一部分学生又会去恳求教授，给他们提供一个正确的模板来模仿，亦或者，他们会找抄袭或论文代笔去走捷径，走向他们想象中的未来。

就好像到了大学以后，学习和思考就再也不用写作来辅助了一样。

不过，这是在ChatGPT火起来之前。现在有了ChatGPT，论文剽窃和代写的乱象已经蔚然成风。虽然说这些现象并不能只怪AI，但已经足以说明大学教育中的问题。

症结在哪里？

这场危机，其实源于大学本科教育中一个更巨大、更古老的问题。

长期以来，人们过分关注收敛思维——换句话说，对于有固定解决方案的问题，去测试学生能否获得问题的「正确」答案。

大学申请的测试通常注重两大类：知识基础和认知能力。标准化的测试能够检测学生对学科掌握程度，但这忽略了另一个重要的领域：发散性思维。

而发散性思维，正是创造性工作的前提。

而且，发散性思维是与标准化背道而驰的。发散思维靠的是深度模式识别和类比（口头、视觉、数学）等机制，而要让ChatGPT从令人眼花缭乱的大数据集中收集「要点」，这并不是它们擅长的。

这种思维可以用一个词形容，那就是「机智」（这种机智是一种令人惊讶的灵感，能够把两个不相干的事物进行融合，或者联系起来），虽然听起来有些玄乎，但这种能力非常重要。

认知科学家、类比思维权威专家Dedre Gentner解释说，生动地向自己或他人解释某事可以培养抽象能力，还可以发现不同领域之间的新联系。

对于Gentner来说，相比于看一个人的智商，他进行准确隐喻或类比的能力，更能体现自己的创造性。因为科学的突破，往往就是通过那「惊鸿一瞥」，让人们发现了两个不同事物之间的类比，这种类比充满想象。

同样的，威廉玛丽学院的创意和创新教授K.H Kim认为，亚洲和西方教育体系对趋同思维的痴迷关注，正在减缓整个艺术和科学的创新。

理想状态下，大学论文是要作者玩一个智力游戏，过程中的各种障碍会绊倒他们，让他们意识到自己对于学科的了解只是冰山一角。应对挑战时，游戏的「音效」会提醒他们保持头脑清醒，意识到自己可能犯了错。

然而ChatGPT展示的是最为糟糕的情况：在一个回音室中，对于批判性共识进行了一个优雅齐整的总结。

胡说八道大师

还记得Harry Frankfurt的那篇哲学文章《论胡说八道》（On Bullshit）吗？他在文章中提到了两个概念：撒谎（虚假）和滔滔不绝地提出令人信服却没有经过仔细考虑的主张（胡诌）。

撒谎的人需要一个准确的真相模型来主动向他人隐瞒真相，而胡说八道者则不需要这种意识。

事实上，胡说八道的人可以一整天都在说真话；在Frankfurt看来，说他们胡说八道不是因为他们话语的真假，而是他们随心所欲不计后果的说话方式。他写道：「就凭这一点，废话比谎言更能成为真理的敌人」。

ChatGPT就是Frankfurt「胡说八道」艺术流派的巅峰之作。它使用大型语言模型将人类可能对某个主题说的话拼凑在一起，这是一种令人毛骨悚然的理解模拟，但与对现实世界的洞察力完全脱节。

ChatGPT最引人注目的一个特点就是，它惟妙惟肖地模仿了许多学术文章中特有的口若悬河、毫无生气的散文风格。

Stephen Marche在Atlantic上发表的文章《大学论文已死》，在我和同事中引起了许多讨论。他给ChatGPT生成的示例文本打了B+，而他在解释时说：「这段话读起来就像填充物一样，但是大多数学生作文也是如此。」

这句话让我非常忧心，但也很无奈。

早在ChatGPT之前，废话文学就一直困扰着我们，但我们难道就要顺其自然，任其发展了吗？

虽然听起来像是无可救药的理想主义，但是我要奋起说不！

一个有责任心的学者，应该让文章回归到它应有的蒙田式传统：对各种可能性进行不同的、创造性的发散探索。

这需要进行一些改革，比如远离大讲堂，在那里，学生和教授之间的唯一接触点是一篇匆匆写好的、匆匆打分的论文。而如果控制在较小的师生比例，足以恢复学生和老师之间以及学生之间的辩证交流。

AI将不断发展。机器学习将在各种领域产生数以百万计的新颖方案。

目前，AI的发展会有两个极端方向：没有新意的趋同和收敛，以及没有「适当性」意识的极端分歧。

这里借用Dean Keith Simonton对于创造力的定义：原创性x适当性。

「适当性」是特定领域的一套庞大的维特根斯坦式的「语言游戏」，其深度和广度只会随着我们的文化变得更加复杂而增加。这套深层次的「游戏」过于微妙，它是非理性的，而且变化迅速，AI无法仅通过挖掘我们的文本来掌握。

在一个理想的未来，教育可能会优先培养所有年龄段的学生在所有学习领域的好奇心、创造力和敏感性。这个项目令人振奋，不过有些迟了。

这并不意味着如果我们比不过AI，就放弃获取知识了，它需要我们重新开始「玩」我们的想法，以及围绕我们如何学习、为什么学习进行元认知的实践。

对于有情感的众生来说，最终极游戏是当他们被邀请按照自己的条件提出问题时，他们的答案会让自己都感到惊讶，他们会发现自己的答案是多么有启发性。

人类自身的神奇思维可是比AI的模仿理解力要好得多。

在文末，小编想说，Colm O'Shea的这篇文章，真的是让我们爱惨了。

经常有读者留言问我们的文章是不是ChatGPT写的，这里可以借用这篇文章的观点来回答：如果你能感受到文章中「惊鸿一瞥」的那一瞬间，这种创作一定是来自人类，而不是AI。

万用检测器 span font-size style 人工智能新闻 $AI 论文

有关突破100万用户！华人本科生最强AI检测器GPTZero：美国宪法是AI写的的更多相关文章

100个python算法超详细讲解：画直线 - 2
1．问题描述使用Python的turtle（海龟绘图）模块提供的函数绘制直线。2．问题分析一幅复杂的图形通常都可以由点、直线、三角形、矩形、平行四边形、圆、椭圆和圆弧等基本图形组成。其中的三角形、矩形、平行四边形又可以由直线组成，而直线又是由两个点确定的。我们使用Python的turtle模块所提供的函数来绘制直线。在使用之前我们先介绍一下turtle模块的相关知识点。turtle模块提供面向对象和面向过程两种形式的海龟绘图基本组件。面向对象的接口类如下：1）TurtleScreen类：定义图形窗口作为绘图海龟的运动场。它的构造器需要一个tkinter.Canvas或ScrolledCanva
ruby-on-rails - 计算数组中的项目跨越数千条记录的 100 条 - 2
我有一个带有Postgres数据库的Rails应用程序，该数据库有一个带有jsonbgenres列的Artists表。有几十万行。该行中的每个流派列都有一个类似["rock","indie","seenlive","alternative","indierock"]的数组，其中包含不同的流派。我想要做的是在所有行中以JSON格式输出每种类型的计数。类似于:{"rock":532,"powermetal":328,"indie":862}有没有办法有效地做到这一点？更新...这是我目前得到的...genres=Artist.all.pluck(:genres).flatten.delet
最强Http缓存策略之强缓存和协商缓存的详解与应用实例 - 2
HTTP缓存是指浏览器或者代理服务器将已经请求过的资源保存到本地，以便下次请求时能够直接从缓存中获取资源，从而减少网络请求次数，提高网页的加载速度和用户体验。缓存分为强缓存和协商缓存两种模式。一.强缓存强缓存是指浏览器直接从本地缓存中获取资源，而不需要向web服务器发出网络请求。这是因为浏览器在第一次请求资源时，服务器会在响应头中添加相关缓存的响应头，以表明该资源的缓存策略。常见的强缓存响应头如下所述：Cache-ControlCache-Control响应头是用于控制强制缓存和协商缓存的缓存策略。该响应头中的指令如下：max-age：指定该资源在本地缓存的最长有效时间，以秒为单位。例如：Ca
未来的趋势————以ChatGPT为标杆的AI对生活的影响是巨大的 - 2
文章目录前言1.AI的发展历程2.我是如何接触到人工智能的概念和产品的3.对于ChatGPT的一点看法4.AI对大学毕业生的职业发展的利与弊5.对于AI的思考和问题前言随着ChatGPT的爆火，生成式AI，大模型的人工智能被越来越多的人注意到，同时他也带来了许多问题。本文将对几方面进行探讨。1.AI的发展历程远古时期在公元前第一个千禧年，中国，印度和希腊哲学家都提出了一些推理的研究理论，比如亚里士多德（Aristotle）进行了演绎推理三段论的完整分析，欧几里得（Euclid）所著Elements是一种形式推理的模型，MuḥammadibnMūsāal-Khwārizmī,发明了代数学，即我们
焕新古文化传承之路，AI为古彝文识别赋能 - 2
目录1古彝文与古典保护2古文识别的挑战2.1西文与汉文OCR2.2古彝文识别难点3合合信息：古彝文保护新思路3.1图像矫正3.2图像增强3.3语义理解3.4工程技巧4总结1古彝文与古典保护彝文指的是云南、贵州、四川等地的彝族人使用的文字，区别于现代意义上的彝文，古彝文指的是在民间流通使用的原生态彝文，多达87046字。古彝文的起源距今至少数千年，是世界上最古老的文字之一。对古彝文字集研究有助于理解尚未被翻译成汉文、用字尚未规范化的古籍，更深层、透彻地作用于传统文化保护。古彝文字义对照图（网络资料+邵文苑供图）古籍是不可再生的宝贵资源，应当得到妥善保护。中国的古籍在历史上迭经水火兵燹等自然灾害、
ruby - `-' :String 的未定义方法 "100" - 2
这段Ruby代码:income="100"bills="52"putsincome-bills抛出一个错误:./to_f.rb:6:undefinedmethod`-'for"100":String(NoMethodError)在对字符串执行数学运算时，Ruby不会自动将字符串转换为数字吗？最佳答案 Ruby是一个dynamically-typed,strictly-typed(或“强类型”)语言。Lua是另一种这样的语言。前者意味着变量可以包含任何类别的值。后者——你遇到的情况——意味着类型强制不会自动发生。将它们与动态类型和松
ruby - 什么是最像 Ruby 的生成 3 个正整数加起来等于 100 的唯一组合的方法 - 2
条件:a+b+c=100a,b,cpositiveintegersor0期望的输出:[[0,0,100],[0,1,99],...#allotherpermutations[99,1,0],[100,0,0]] 最佳答案我会写:(0..100).flat_map{|x|(0..100-x).map{|y|[x,y,100-x-y]}}#=>[[0,0,100],[0,1,99]],...,[99,1,0],[100,0,0]]站点注释1:这是一个经典示例，其中列表推导式大放异彩(如果某处有条件则更是如此)。由于Ruby没有LC，我
ruby - 解析 100mb JSON 负载的有效方法 - 2
我每12小时在我的亚马逊EC2微型实例上运行一次cron作业。它下载118MB的文件并使用json库解析它。这当然会使实例内存不足。我的实例有416MB的可用内存，但随后我运行脚本，它下降到6MB，然后被操作系统杀死。我想知道我在这里有什么选择？是否可以通过Ruby有效地解析它，或者我是否必须下降到像C这样的低级东西？我可以获得一个功能更强大的亚马逊实例，但我真的很想知道是否可以通过Ruby做到这一点。更新:我看过yajl。它可以在解析时为您提供json对象，但问题是，如果您的JSON文件仅包含1个根对象，那么它将被迫解析所有文件。我的JSON看起来像这样:--Root-Obj1-Ob
【华为OD机试真题 java、python、c++】荒地电站建设【2022 Q4 100分】（100%通过+复盘思路） - 2
代码请进行一定修改后使用，本代码保证100%通过率，本题目提供了java、python、c++三种代码。复盘思路在文章的最后题目描述祖国西北部有一片大片荒地，其中零星的分布着一些湖泊，保护区，矿区;整体上常年光照良好，但是也有一些地区光照不太好。某电力公司希望在这里建设多个光伏电站，生产清洁能源对每平方公里的土地进行了发电评估，其中不能建设的区域发电量为0kw，可以发电的区域根据光照，地形等给出了每平方公里年发电量x千瓦。我们希望能够找到其中集中的矩形区域建设电站，能够获得良好的收益。输入描述第一行输入为调研的地区长，宽，以及准备建设的电站【长宽相等，为正方形】的边长最低要求的发电量之后每行为
ruby - 数组中的 1 到 100 个奇数 - 2
在Ruby中有什么很酷的方法可以创建一个1到100的数组，其中只有奇数项(1、3等)。我现在有一个循环，但这显然不是一个很酷的方法!有什么建议吗？我当前的代码:defcreate_1_to_100_odd_arrayarray=[1]i=3whilei提前致谢最佳答案 Range类为此目的提供了一个非常酷的功能:1.9.3-p286:005>(1..10).step(2).to_a=>[1,3,5,7,9] 关于ruby-数组中的1到100个奇数，我们在StackOverflow上找到