jjzjj

内测挤爆的文心一言,能否迎战GPT-4?

局外人一枚 2023-04-11 原文

2月7日,百度宣布推出ChatGPT类型人工智能产品“文心一言”,并于3月份完成内测向公众开放。一个多月后的今日,在北京百度总部和上海张江人工智能岛,文心一言如期而至。

百度董事长兼CEO李彦宏介绍,文心一言在商业文案创作、数理推算等方面有突出能力,同时他也承认,文心一言“并没有完全ready(准备好)”。

背负着国内市场的期待,文心一言为何要匆忙上线?业内人士认为,国内GPT技术的发展,要以抢占应用场景为先机,再辅助以算法技术的迭代,“边学边赶”才能有机会与国际AI巨头迎头赶上。

具备更强中文理解力

发布会现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。此外,文心一言准确回答了《三体》作者、电视剧角色扮演者等事实性问题。据介绍,AICG内容回答事实性问题时容易出现事实性差错,而文心一言延续了百度知识增强的大模型理念,大幅度提升了事实性问题的准确率。

在商业文案创作场景中,文心一言也完成了给公司起名、写口号和新闻稿的创作任务。

“AI要写好一篇稿子,除了需要准确理解我们的意图,还要有清晰的表达能力。”李彦宏解释称,人类常说“读万卷书”,AI则是 “读书破千亿卷”。文心一言大模型的训练数据包括万亿级网页、数十亿的搜索数据和图片、百亿级的语音日均调用数据以及5500亿条事实的知识图谱等。“有研究表明,数据规模足够大,参数达到千亿级,大模型就可能发生‘智能涌现’,即使在没有专门训练过的领域,也能涌现出知识理解和逻辑推理能力。”

文心一言还具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。

值得一提的是,文心一言扎根于中国市场的大语言模型,因而具备中文领域先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。

除了日常的对话,李彦宏现场还展示了文心一言生成文本、图片、音频和视频的能力,还能够生成四川话等方言语音。不过遗憾的是,视频生成能力因成本较高,现阶段还未对所有用户开放。

“多模态是生成式AI一个明确的发展趋势。”李彦宏表示,“未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”

常用功能表现正常,漏洞仍然不少

“十月怀胎,一朝分娩。”李彦宏在发布会上如是形容文心一言的诞生。

据悉,文心一言的上线已连续多日进行压力测试,亚洲目前最大的单体智算中心山西阳泉百度智算中心,已经将算力提升到每秒可以完成400亿亿次浮点运算,并与全国其他几座智算中心共同为文心一言提供算力支持。

除了日常对话外,文心一言还提供了写报告、AI作画和查知识点三个功能模板。

文心一言在“传统媒体融合转型”为题的报告中,不仅解释了“媒体融合”的意义,还给出了数字化转型、内容创新、用户分析等多方面建议。懂经哥发现这些内容并非是搜索引擎的直接呈现,而是经过大模型的整理和归纳。在查知识点和AI作画方面,文心一言也正常表现,通常在一分钟内能够给出反馈。

不过,懂经哥在试用时发现,文心一言在交流方面仍有不少漏洞,时常出现前后矛盾的现象。另外,在对话过程中缺少上下文之间的呼应,更像是一对一的应答。

也有部分内测用户表示,同样的问题抛给文心一言和GPT-4,两者的答案有一定差距。比如《三体》的续写,“文心一言”的答案比较抽象,比如生命的意义、人类的宇宙关系,而GPT-4的回答更具体、更有冲突感,比如类人机器人的崛起、黑暗森林法则的挑战等。

试用申请挤爆测试网页

本月15日,OpenAI推出了GPT-4,市场反馈优于ChatGPT,文心一言今日上线,难免与GPT-4将有所比较。

百度早在2019年推出了文心大语言模型,以此为基础的文心一言也属于百度多年来的“厚积薄发”,不过就连李彦宏自己也承认:“不能说我们完全ready了,文心一言对标ChatGPT,甚至是对标GPT-4,门槛仍然是很高的,我自己测试感觉还是有很多不完美的地方。”

或许是担心文心一言的稳定性,李彦宏在发布会现场并未使用现场实时演示,而是采用提前录制好的视频进行了文心一言的能力展示。李彦宏也表示,该模型目前还存在一定不足,“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

资本市场对文心一言的反应也不尽理想。今日午后,百度的港股出现持续下挫,跌幅一度达到近10%,随后略有收窄。截至收盘,百度股价报收125.1港元/股,跌6.36%,总市值3458亿港元。

文心一言为何仓促上线?百度今日披露的两组数据能说明问题——短短一个月的时间,超过650家合作伙伴宣布加入文心一言生态;发布会后一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家,申请产品测试网页多次被挤爆,百度智能云官网流量飙升百倍。

“大家都希望能早一点用上最新最先进的大语言模型。”难怪李彦宏直言,“文心一言”并不完美,但市场有需求必须要推出来。

对于“用市场换时间”的做法,360创始人周鸿祎也公开表示认同。“目前国内发展GPT技术,首先要占据应用场景,同步全力发展核心算法技术。”他表示GPT技术的应用场景需要复杂的工程化和商业化的能力,以及丰富的数据清洗和人工标注的经验,如果等国内的算法赶上GPT-4再上马,市场就错过了。

GPT概念是风口还是泡沫?

除了文心一言外,国内已有多家机构和企业推出类GPT大模型。今年2月,小冰公司的ChatGPT应用“小冰链(X-Chain of Thought & Action)”开启了小范围内测。3月初,复旦大学计算机科学技术学院邱锡鹏团队发布类ChatGPT模型MOSS,目标是打造一个具有中国特色的中文大型语言模型;360也表示将借鉴微软与OpenAI能力结合所推出的New Bing模式 ,推出新一代智能搜索引擎,并基于搜索场景推出人工智能个人助理类产品。阿里达摩院类ChatGPT产品已处于内测阶段,京东云将推出产业版ChatGPT—ChatJD……更多大模型也在逐步内测推进中。

据国际数据公司(IDC)测算,2021年全球市场人工智能市场收入规模达850亿美元,并将于2025年突破2000亿美元大关,复合年均增长率高达24.5%。另据中信建投报告显示,中国人工智能行业发展势头凶猛,在全球人工智能产业化地区中仅次于美国和欧盟,约占全球市场规模的9.6%,2022年中国人工智能市场规模达2729亿元。

GPT概念到底是风口还是泡沫?国研新经济研究院创始院长朱克力告诉懂经哥:“如百度等技术型公司已在大模型领域深耕多年,AI技术较为成熟,文心一言的出现无疑是利好,抓住这一机会能优先抢占市场。”他也劝告投资者切勿盲目跟风,一些企业缺少技术优势,仅以ChatGPT为噱头赢得股市青睐,一旦泡沫戳破将损失惨重。”

“AI市场爆发性的需求增长,将释放出前所未有的、指数级的商业价值。”李彦宏预测,大语言模型将带来云计算、模型精调和应用服务提供商三大产业机会,“基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。”

国信证券研报也认为,AIGC应用场景有望全面爆发,作为生产力工具还将不断推动聊天机器人、数字人、元宇宙等领域发展。作为推动人工智能发展的三大要素,算法目前仍在迭代,数据积累量不够,算力也刚刚突破,“三兄弟”的突破还将不断创造出新的业态和应用。

有关内测挤爆的文心一言,能否迎战GPT-4?的更多相关文章

  1. 报告回顾丨模型进化狂飙,DetectGPT能否识别最新模型生成结果? - 2

    导读语言模型给我们的生产生活带来了极大便利,但同时不少人也利用他们从事作弊工作。如何规避这些难辨真伪的文字所产生的负面影响也成为一大难题。在3月9日智源Live第33期活动「DetectGPT:判断文本是否为机器生成的工具」中,主讲人Eric为我们讲解了DetectGPT工作背后的思路——一种基于概率曲率检测的用于检测模型生成文本的工具,它可以帮助我们更好地分辨文章的来源和可信度,对保护信息真实、防止欺诈等方面具有重要意义。本次报告主要围绕其功能,实现和效果等展开。(文末点击“阅读原文”,查看活动回放。)Ericmitchell斯坦福大学计算机系四年级博士生,由ChelseaFinn和Chri

  2. ruby - whenever gem 能否保留 crontab 文件中的现有行? - 2

    我正在使用:ruby1.9.2每当0.7.2Capistrano2.9.0capistrano-ext1.2.1我在部署时与Capistrano结合使用来管理我的crontab文件。我注意到它每次都会完全重写我的crontab文件。我希望能够在cron中设置环境变量来控制PATH和MAILTO设置,它们是常规的cron环境变量。有没有办法让whenever不覆盖整个crontab文件,以便我可以将自定义添加到我的crontab文件并确保它们会持续存在? 最佳答案 是的,你可以做到这一点。您只需要为写入crontab的任务分配一个标识

  3. objective-c - MacRuby/HotCocoa 能否取代对 Objective-C 的了解? - 2

    我刚刚发现MacRuby/HotCocoa,非常喜欢他们正在做的事情的声音。我基本上不考虑自己制作CocoaGUI应用程序的前景,因为我厌恶花时间和精力学习另一种基于C的语言Objective-C。我并不是说它不好,只是不适合我。现在或在可能的future,是否可以完全忽略Objective-C而仅使用MacRuby/HotCocoa来制作具有实质性和一流性质的CocoaGUI应用程序?(编辑:桌面Mac,而非iPhone) 最佳答案 "ItisthegoalofMacRubytoenablethecreationoffull-fl

  4. 评测:对接GPT-4的NewBing使用体验变化 - 2

    GPT-4是OpenAI发布的最新一代语言模型,于2023年3月14日正式发布,并通过API和ChatGPTPlus平台向用户开放。微软也证实,在GPT-4正式发布之前,就已经在部分版本的Bing中使用GPT-4技术。本文旨在对使用GPT-4技术的NewBing进行中立、专业的使用评测,探讨其使用体验的变化。界面与限额早于2月26日小编获得Newbing试用资格,届时Newbing初体验并不理想,限制多,例如对话只能持续5条自动终止,对话字符受限,生成效果不尽如人意。然而今日对接GPT-4全新bing额度扩充至15条,且对话字数扩容至2000字。Newbing提供了三种模式选项,即创造力、平衡

  5. ruby - Ruby 方法能否作为迭代器产生或根据上下文返回数组? - 2

    我在Ruby中有一个任意方法可以产生多个值,因此可以将其传递给一个block:defarbitraryyield1yield2yield3yield4endarbitrary{|x|putsx}我想修改此方法,以便在没有block的情况下,它仅将值作为数组返回。所以这个构造也可以工作:myarray=arbitrarypa----->[1,2,3,4,5]这在Ruby中可行吗? 最佳答案 defarbitraryvalues=[1,2,3,4]returnvaluesunlessblock_given?values.each{|va

  6. ruby - Ruby 能否访问出现的 shell 命令的输出? - 2

    我的Ruby脚本正在运行一个shell命令并解析它的输出。但是,似乎该命令首先执行并将输出保存在数组中。我希望能够在打印时实时访问输​​出行。我玩过线程,但还没有让它工作。有什么建议吗? 最佳答案 您正在寻找管道。这是一个例子:#Thisexamplerunsthenetstatcommandviaapipe#andprocessesthedatainRubyasitcomebackpipe=IO.popen("netstat3")while(line=pipe.gets)printlineprint"and"end

  7. ruby - Ruby 的 stdlib Logger 类能否安全地处理来自多个进程的编写器? - 2

    我正在开发一个需要进行日志记录的Ruby库。理想情况下,我希望多个工作进程能够登录同一个文件。查看来自Ruby标准库的Logger类的源代码,我看到努力从多个线程同步写入日志(正如对IsRuby'sstdlibLoggerclassthread-safe?的回答中所指出的)。当多个进程写入同一个日志文件时,似乎存在类似的问题:根据底层决定缓冲/拆分写入的方式,每个日志消息可能无法保持其完整性。那么,有没有一种方法可以使用标准的Logger类来允许多个进程安全地记录到一个文件中?如果不是,这在Ruby项目中通常是如何完成的?这就是我所说的“安全”的意思:每个日志行都是“原子的”——在下一

  8. 生成式人工智能(AIGC)综述:ChatGPT从GPT-4到GPT-5可以一统AIGC? - 2

    原文题目:《ACompleteSurveyonGenerativeAI(AIGC):IsChatGPTfromGPT-4toGPT-5AllYouNeed?》文章链接:https://arxiv.org/abs/2303.11717https://arxiv.org/abs/2303.11717引言:随着ChatGPT的火热传播,生成式AI(AIGC,即AI生成的内容)因其分析和创造文本、图像等能力而在各地引起了轰动。在如此强烈的媒体关注下,我们几乎不可能错过从某个角度欣赏AIGC的机会。 “一个具有未来科幻感的机器人坐着,手握画笔正在创作一幅五颜六色的图画“由dalle2创作在AI从纯分析转

  9. javascript - VS Code 能否在文件重命名/移动时自动更新 JavaScript 和 TypeScript 导入路径? - 2

    是否有用于vscode的模块可以更新文件路径?例如如果我有:import'./someDir/somelib'然后我重命名或移动somelib,它会自动更新所有被引用的文件中的文件路径吗? 最佳答案 此功能是在VSCode1.24(trackingissue)中为JavaScript和TypeScript添加的当您移动或重命名文件时,系统现在会提示您查看是否要更新导入:这由javascript.updateImportsOnFileMove.enabled和typescript.updateImportsOnFileMove.ena

  10. 文心一言发布的个人看法 - 2

    文心一言发布宣传视频按照发布会上说的,文心一言并非属于百度赶工抄袭Chat-GPT的作品,而是十几年一直布局AI产业厚积薄发的成果,百度在芯片,机器学习,自然语言处理,知识图谱等方面均有相对深厚的积累。国内互联网目前真正有核心竞争力的产品并不多。多数处于应用层,导致内卷无限加剧。这个姑且不算为绝对的”创新“,目前文心一言仅仅对中文训练有达到一定的成熟度,英文支持并不友好。开放内测的目的是为了,利用公共资源进一步完善文新一言训练。关于创造力的一些理论富有创造力的人通 常有他们自己的理论,而且彼此间的理论相当不同。罗伯特· 高尔文说 创造力包含预期与奉献:预期是指在其他人认识到之前,便预见到某个事

随机推荐