竞品还在追赶 OpenAI用GPT-4飚赢自己

元宇宙日爆 2023-12-23 原文

赶在百度“文心一言”发布前一天，OpenAI祭出了GPT-4，这对于百度、谷歌们来说，可能是一个重大打击。

人们已经领略过GPT-3.5加持下的ChatGPT，但GPT-4比“前辈”更强大，它具有更高的可靠性和准确性，能够读懂图片，甚至还能角色扮演。目前，GPT-4已被应用到ChatGPT和Bing上，再一次刷新外界对AI的能力认知。

GPT-4越耀眼，谷歌、百度等竞争对手们便越焦虑。毕竟，其他公司忙着对标GPT-3.5时，OpenAI快速将大模型升级为GPT-4，一骑绝尘的样子丝毫“不讲武德”，像一个孤独求败的杀手，眼望着挑战者的到来。

GPT-4打败GPT-3.5

知名KOL和菜头说，因为OpenAI在3月15日凌晨发布了GPT-4，他和他的一些老朋友都没睡好，微信里的消息提示此起彼伏，“感觉像是回到了乔布斯还在世的时候，大家相约线上看苹果发布会的那些夜晚。”

北京时间3月15日凌晨，GPT-4发布受万众瞩目，这是采用GPT-3.5的ChatGPT火爆后的必然结果。看客们想要知道，它比GPT-3.5到底强多少？人们甚至没有兴趣拿它来对比别的同类产品，因为能站在同一起跑线上与之对比的还没有出现。

OpenAI很了解围观者的胃口，在那场更像是产品演示的发布会里，开发者一上来就让GPT-3.5和GPT-4分别尝试回答同样的问题。结果，熬夜的人没白等。

一开始，OpenAI的开发者复制了一篇博客文章，并交给了GPT-3.5，让它进行总结，要求是每个单词都要以“G”开头。结果GPT-3.5直接选择了放弃。轮到GPT-4，它快速地给出了答案，完全符合要求。随后，开发者又让它尝试以字母“A”开头回答同样的问题，GPT-4又做到了。

这还没完，如同提升“节目效果”一样，开发者直接和Discord社群互动起来，选取了网友提出的字母“Q”。再来一遍，GPT-4依然轻松拿捏。

这轮演示，OpenAI特地选取了一个超过GPT-3.5“阈值”的问题来测试，意在表现GPT-4的能力进化水平。正如官方所解释的，在随意的谈话中，GPT-3.5 和 GPT-4 之间的区别可能很微妙，当任务的复杂性达到足够的阈值时，差异就会出现——GPT-4比GPT-3.5更可靠、更有创意，并且能够处理更细微的指令。

为了全面且可视化地评估GPT-4的能力提升程度，OpenAI展示了它与GPT-3.5共同参与了多项模拟考试的情况，包括统一律师资格考试、研究生入学考试、医学知识自测、艺术史、微积分等等，结果GPT-4几乎碾压了GPT-3.5。比如，在模拟律师考试中，GPT-4的分数在应试者的前10%左右，而GPT-3.5 的得分排在倒数10%左右。

各项考试中GPT-4领先GPT-3.5

如同苹果发布会每次都会带来一个大彩蛋，GPT-4也带来了一项跨越式的功能——接受视觉输入。这意味着，GPT-4能够看懂图片了。

官方解释：GPT-4在给定由散布的文本和图像组成的输入的情况下，可生成文本输出（自然语言、代码等）。换言之，给它一张带有文字的图片，并提出要求，它就能给出想要的结果。

在演示中，开发者画了一张网站的草图，要求GPT-4用简短的 HTML/JS 将这个草图变成彩色的网站。仅仅几秒钟后，GPT-4就带来了一个完整的网页。

不仅如此，GPT-4还能尝试理解一些流行的“梗图”。如下图所示，让它解释这张图的笑点在哪，GPT-4不但Get到了，还一本正经地解释了一通。

GPT-4解释“梗图”的笑点

GPT-4的识图功能只有体验过才能知道是否如OpenAI说得这么厉害。遗憾的是，目前视觉输入还没有完全开放，仅在一小部分开发者中进行测试。OpenAI创始人Sam Altman解释称，此举是为了防止可能出现的安全性和伦理问题。

GPT-4还有一项特别本领，它可以扮演不同的角色和说话的方式，这与具有固定语气和风格的GPT-3.5不同。基于这个功能，用户可以让GPT-4实现角色扮演并定制它的性格。

就像当年的一代代新款iPhone给人们带来惊奇感受，GPT-4展现了比它的上一代更强大的能力。不过，它也并不完美。与GPT-3.5一样，GPT-4有时仍会虚构事实，“一本正经地胡说八道”还不能完全避免。OpenAI宣称，在内部对抗性真实性评估中，GPT-4的得分比GPT-3.5高40%，显然，它还有很大的提升空间。

谷歌、百度更焦虑了

OpenAI正和当初的苹果走在一样的道路上：成为引领者，并在别人苦苦追赶时，又猛地拉开一大截。

就在GPT-4发布前，互联网巨头谷歌也在YouTube上发布了一支预告片，宣布将AI整合到Gmail电子邮件和GoogleDocs文档等办公应用中。谷歌在视频中费了很大力气展示相关功能，告诉人们可以在文件中进行头脑风暴、校对、写作和改写；利用幻灯片中自动生成的图片、音频和视频，将创意构想变为现实等。

然而，“一点水花都没有，几个小时之后GPT-4开发布会，人一下子就全跑光了。”和菜头如此描述他的观察。从社交网络上舆论风向看，谷歌的AI新动作被铺天盖地的GPT-4消息所淹没——无论是海外的推特还是国内的微博，GPT-4都登上了热搜榜。

和谷歌一样被冷落的AI玩家还有Meta。不久前，Meta公布了旗下全新的AI大型语言模型LLaMA，宣称可帮助研究人员降低生成式AI工具可能带来的“偏见、有毒评论、产生错误信息的可能性”等问题。Meta还放话，这一大模型仅用约1/10的参数规模，就能匹敌OpenAI GPT-3、谷歌PaLM等主流大模型的性能表现。这一新动态在GPT-4到来后，没有在舆论场上再露脸。

OpenAI的光芒越盛，其他科技巨头们就越焦虑。

2月，仓促应战ChatGPT的谷歌还闹出过笑话，其开发的聊天机器人Bard首秀“翻车”，答错问题导致其市值一天之内蒸发约1000亿美元。

在国内，百度也在加急研发与ChatGPT类似的聊天机器人“文心一言”。按照预告，百度将在今天下午举办有关文心一言的新闻发布会。在许多人也许还在好奇文心一言能否比肩GPT-3.5模型下的ChatGPT，结果，OpenAI赶在百度发布会前带来了更强大的GPT-4。

别人忙着对标GPT-3.5时，OpenAI如同冷血杀手一般，亲手击败了自己出品的GPT-3.5。同类竞争公司们有多焦虑，网友们已经自行脑补出了各种“梗图”。

“那种提刀在手，环顾天下，寂寞如雪的感觉，让我忍不住感慨：即便在美国本土，这件事也和绝大多数美国科技公司无关了。”和菜头形容，OpenAI迭代的速度让他感觉到心惊肉跳，“所有试图追赶的人和公司，目前落后进度最少两年。在这种AI爆发式增长的时代，两年就是三辈子。”

回顾GPT的发展，它用5年时间里完成了从量变到质变的飞跃。2018年，GPT-1首次发布，当时的模型参数只有1.17亿个，随后的GPT-2将标准提高到15亿个参数，GPT-3和GPT-3.5的神经网络直接提升到1750亿个参数，而到了GPT-4，采用的参数超过2000亿个，并利用了超过200万个数据源（GPT-3.5使用了45万个数据源），包括互联网上的各种文本、图像、音频和视频数据。

相比之下，2022年初谷歌曾披露其LaMDA 模型参数为1370亿个，不如当时的GPT-3多。而据百度透露，文心一言大模型参数规模达到2600亿，相比GPT-4更多，这或许还能让它留给人们一些期待。

不过，有专家指出，模型参数并不是决定AI聊天机器人能力的绝对因素，在此基础上，对数据的清洗和标注、模型结构设计、训练推理的技术积累都会决定最终产品的表现。

GPT-4甚至不用担心产品化了，它已经应用于ChatGPT和微软的搜索引擎必应（Bing）上。一骑绝尘后，尘土里若隐若现着谷歌和百度。

追赶 OpenAI xff0c xff0 xff microsoft ai chatGPT

有关竞品还在追赶 OpenAI用GPT-4飚赢自己的更多相关文章

ruby-on-rails - 如何测试自己对 Ruby/ROR 的了解？ - 2
是否有self验证的问题列表。看着那个，我可以确定我知道。我应该复习一下。在学习的过程中，我列了一个这样的list，但它只包含我在某处听说过的项目。我需要一段时间才能找到新的东西。最佳答案以下是针对ruby和Rails的一些测试列表。证书名称:RubyonRails谁提供:oDeskIncorporation认证费用:免费网站:https://www.odesk.com/tests/985?pos=0证书名称:RubyonRails提供者:Techgig.com(TimesBusinessSolutionsLimited(T
ruby - 如何构建自己的自定义 session 存储类？ - 2
默认情况下，session存储在浏览器cookie(:cookie_store)中，但您也可以指定其他包含的存储之一(:active_record_store、:mem_cache_store或您自己的自定义类。请提供我构建自定义类的方式config.action_controller.session_store=:your_customer_class 最佳答案 MaurícioLinhares是正确的，但是，我想添加一些细节，因为我认为您需要实现哪些方法并不明显。你可以继承自ActionDispatch::Session::Ab
如何使用手机远程访问自己的电脑？ - 2
手机访问电脑后AnyViewer可以做什么？您成功将手机连接到Windows电脑后，然后您可以做任何您想做的事情，例如：查看文件和运行应用程序。电源管理：在远程会话中，点击电源管理，您可以看到三个项目：锁定、重启和关机，供您在不同情况下管理计算机。如果您需要暂时离开远程会话，可以锁定计算机。如果计算机死机，您可以重新启动它，然后再次连接。如果您已完成计算机上的所有工作，您可以使用手机远程关闭它。更改图像质量：当电脑和手机的网络都处于良好状态时，您可以选择高图像质量以获得更好的体验。当网络状况不佳时，您可以选择低图像质量以获得更流畅的操作。显示桌面：我们无法在手机上按Windows+
ruby - OpenSSL 验证来自自己 CA 的证书 - 2
大家好，感谢您花时间阅读本文。我需要验证由我自己的CA颁发的证书，我有一个证书。我怎样才能做相当于openssl的openssl验证-CAfile在Ruby代码中？OpenSSL的RDoc在这方面不是很有帮助。我试过:require'openssl'ca=OpenSSL::X509::Certificate.new(File.read('ca-cert.pem'))lic=OpenSSL::X509::Certificate.new(File.read('cert.pem'))putslic.verify(ca)但我得到:test.rb:7:in`verify':wrongargume
ruby - 为什么我可以在 Ruby 中将一个 undefined variable 赋值给它自己并得到 nil？ - 2
这个问题在这里已经有了答案:关闭10年前。PossibleDuplicate:Whya=aisnilinRuby?我们应该说，在Ruby中使用undefinedvariable是“奇怪的现象”。是这样的:#irbsessionfollows#foo#undefinedlocalvariableormethod'foo'bar#samefor'bar'foo=bar#stillsamefor'bar'foo=foo#nil-HUH?foo#isnowsettonil!?为什么我可以在Ruby中将一个undefinedvariable赋值给自身并得到nil？请注意，我在这里使用的是Ruby
ruby - 如何在 heroku 中使用自己的 mysql 数据库服务器？ - 2
我想使用托管在我自己服务器上的mysql数据库。我已经更改了DATABASE_URL和SHARED_DATABASE_URL配置变量以指向我的服务器，但它仍在尝试连接到heroku的amazonaws服务器。我该如何解决？最佳答案根据Herokudocumentation，更改DATABASE_URL是正确的方法。Ifyouwouldliketohaveyourrailsapplicationconnecttoanon-Herokuprovideddatabase,youcantakeadvantageofthissamemec
ruby-on-rails - RailsAdmin - 定制你自己的过滤器 - 2
我正在使用https://github.com/sferik/rails_admin处理我的管理界面。可以根据此模型中存在的当前列(id、created_at等)过滤您的模型我希望能够为关联添加自定义过滤器。例如:当我探索“城镇”模型时，我希望能够仅显示具有一个或多个项目的城镇。我可以通过向城镇添加一个新列来做到这一点，称为has_projects作为bool值，当有1个或多个项目关联时将设置为true，但我觉得必须有一种更简洁的方法来制作您自己的自定义过滤器？最佳答案您可以尝试使用枚举。参见https://github.com
ruby-on-rails - 是否有针对 Rails、Ruby、Erb 的 Xcode 语法着色？如果没有，我怎么能自己写一个？ - 2
Xcode的语法着色充其量只是很差，而textmate看起来不错，但我喜欢Xcode，因为我也用C++编程。我想将所有内容都放在一个地方并利用其他Xcode功能。有没有人已经这样做过或者有没有简单的方法来做到这一点？最佳答案你可以去Editor>SyntaxColoring>CheckHTMLanddoitagainforRuby 关于ruby-on-rails-是否有针对Rails、Ruby、Erb的Xcode语法着色？如果没有，我怎么能自己写一个？，我们在StackOverflo
ruby - 为什么 Ruby 使用自己的安全导航运算符语法？ - 2
Ruby2.3.0引入了安全导航语法，它通过引入一个新的运算符来简化链式方法调用的nil处理，该运算符仅在先前语句的值不是nil。这是一个已经存在于C#、Groovy和Swift中的特性。例如inGroovy,语法是foo?.bar这基本上意味着结果值是foo.bar除非foo是null，在这种情况下返回值也是null因此不会抛出异常。还有C#(称为空条件运算符)和Swift(称为可选链接表达式)使用此表示法。所以语法在其他语言中似乎是相当标准的。现在，为什么在Ruby中语法是foo&.bar代替？最佳答案此答案基于thedis
ruby-on-rails - 何时使用设计与创建我自己的身份验证 - 2
如标题中所述，什么时候应该使用设计，什么时候应该实现我自己的身份验证。本质上，我想知道某些教程(例如this一个)中创建的身份验证是否安全可靠。如果我不需要电子邮件确认、可恢复性等(许多与Devise相关的“爵士乐”)，帐户信息是否会像我创建自己的帐户一样安全？如果您仍然对我正在寻找的答案感到困惑–您是否应该尽可能/只要有帐户就使用Devise？或者它真的应该是一个决定吗？注意:我并不是专门指Devise，任何身份验证gem都可能被替换。最佳答案 implementmyownauthentication任何时候您开始考虑是否应该创

竞品还在追赶 OpenAI用GPT-4飚赢自己

GPT-4打败GPT-3.5

谷歌、百度更焦虑了

有关竞品还在追赶 OpenAI用GPT-4飚赢自己的更多相关文章

随机推荐