今天凌晨,OpenAI官方发布ChαtGΡΤ和Whisper的接囗,开发人员现在可以通过API使用最新的文本生成和语音转文本功能。OpenAI称:通过一系列系统级优化,自去年12月以来,ChαtGΡΤ的成本降低了90%;现在OpenAI用这些节省下来的成本造福广大开发者。开发人员现在通过API使用Whisper v2大模型,从而获得更快的速度和更经济成本。ChαtGΡΤ模型会不断得到升级改进,并提供专用容量来对模型进行更深入的控制。

文章目录
OpenAI发布的ChαtGΡΤ模型名称为gpt-3.5-turbo,它与ChαtGΡΤ产品中使用的模型相同。价格0.002美元/1000 token,比之前的text-davinci-003便宜10倍。gpt-3.5-turbo在聊天场景下表现经验,许多非聊天场景应用也可以表现优秀,开发者只需要极少调整就可以将模型由text-davinci-003切换到gpt-3.5-turbo。

OpenAI会不断改进 ChαtGΡΤ 模型,因此gpt-3.5-turbo模型会不断更新(4月会升级到最新稳定版本),OpenAI也推荐大家使用gpt-3.5-turbo模型。为了满足开发者对特定模型版本的需求,OpenAI还提供了特定快照版。目前提供的特定快照版为gpt-3.5-turbo-0301,该版本在接下来的三个月内不更新,有效期到2023年6月1日。
| 模型名称 | 描述 | 最大请求 | 训练数据 |
|---|---|---|---|
| gpt-3.5-turbo | 功能最强大的 GPT-3.5 模型,并针对聊天场景进行了专门优化,成本仅为 text-davinci-003 的 1/10。 会不断迭代更新。 | 4,096 tokens | 截至2021年6月 |
| gpt-3.5-turbo-0301 | gpt-3.5-turbo的2023年3月1日快照版本。此模型在加下来3个月内不会更新,有效期截止2023年6月1日。 | 4,096 tokens | 截至2019年10月 |
由于gpt-3.5-turbo为聊天而场景设计,所以接口设计上发生了一点变化。在GPT-3接口中,问题是通过prompt字段传入的,gpt-3.5-turbo没有prompt字段,取而代之的是messages数组。下面是一个典型的接口调用例子:
import openai
completion = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[
{"role": "system", "content": "你是一个聪明的助理"},
{"role": "user", "content": "哪支球队赢得了2018世界杯?"},
{"role": "assistant", "content": "法国国家男子足球队获得2018年俄罗斯世界杯。"},
{"role": "user", "content": "决赛对手是谁?"}
]
)
print(completion)
上面示例代码中,我们将多轮对话封装到messages数组中,每条消息都有role和content。role的可选值为system, user, assistant,content是消息内容。
通常,对话的格式首先是system消息,然后是交替的user消息和assistant消息。
system消息有助于设置模型的行为。在上面的例子中,模型被告知“你是一个聪明的助理”,模型就会扮演一个助理角色,输出的内容会尽可能像一个助理一样简洁清晰。
user消息有助于指导模型。它即可以是用户的问题(通常是最后一条),也可以是开发人员的指令设置或上下文提示。
assistant消息有助于存储上下文。它即可以是模型之前的输出,也可以由开发人员编写,用于给出所需行为的示例。
由于模型没有过去请求的记忆,所以必须通过对话提供所有相关信息。因此包含历史回话有助于模型更好理解问题。上面实例中,如果没有中间的user消息和assistant消息,单独问模型"决赛对手是谁?"模型是很难给出正确回答的。
gpt-3.5-turbo的返回数据格式也稍有变化。GPT-3接口的输出封装在text字段中,gpt-3.5-turbo的输出封装在message字段中,并且同样由role和content构成。我们可以简单地通过completion['choices'][0]['message']['content']获取输出。
由于gpt-3.5-turbo的表现与text-davinci-003类似,但价格是text-davinci-003的1/10,因此官方建议在大多数使用情况下使用gpt-3.5-turbo。
对于开发者来说,需要改动的地方很少,只需要将prompt改为messages格式即可。
"prompt": "哪支球队赢得了2018世界杯?"
改为:
messages: [
{"role": "system", "content": "你是一个聪明的助理"},
{"role": "user", "content": "哪支球队赢得了2018世界杯?"}
]
或者更简单地改为:
messages: [
{"role": "user", "content": "哪支球队赢得了2018世界杯?"}
]
⚠注意:gpt-3.5-turbo和gpt-3.5-turbo-0301不支持微调。
Whisper是OpenAI于2022年9月开源的语音转文本模型,推出后获得开发者社区的极大赞誉。现在我们可以通过API调用Whisper v2模型,价格为0.006美元/分钟。与其他服务相比,高度优化的服务堆栈可确保Whisper具有更快的性能。

Whisper API提供transcribe 和 translate接口,支持多种音频格式(m4a、mp3、mp4、mpeg、mpga、wav、webm)。
import openai
audio_file= open("/path/to/file/audio.mp3", "rb")
transcript = openai.Audio.transcribe("whisper-1", audio_file)
import openai
audio_file= open("/path/to/file/audio.mp3", "rb")
transcript = openai.Audio.translate("whisper-1", audio_file)
Whisper目前支持南非荷兰语、阿拉伯语、亚美尼亚语、阿塞拜疆语、白俄罗斯语、波斯尼亚语、保加利亚语、加泰罗尼亚语、中文、克罗地亚语、捷克语、丹麦语、荷兰语、英语、爱沙尼亚语、芬兰语、法语、加利西亚语、德语、希腊语、希伯来语、印地语、匈牙利语、冰岛语、印度尼西亚语、 意大利语、日语、卡纳达语、哈萨克语、韩语、拉脱维亚语、立陶宛语、马其顿语、马来语、马拉地语、毛利语、尼泊尔语、挪威语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、塞尔维亚语、斯洛伐克语、斯洛文尼亚语、西班牙语、斯瓦希里语、瑞典语、他加禄语、 泰米尔语、泰语、土耳其语、乌克兰语、乌尔都语、越南语和威尔士语。
支持中文!支持中文!支持中文!
昨晚看到IDEA官推宣布IntelliJIDEA2023.1正式发布了。简单看了一下,发现这次的新版本包含了许多改进,进一步优化了用户体验,提高了便捷性。至于是否升级最新版本完全是个人意愿,如果觉得新版本没有让自己感兴趣的改进,完全就不用升级,影响不大。软件的版本迭代非常正常,正确看待即可,不持续改进就会慢慢被淘汰!根据官方介绍:IntelliJIDEA2023.1针对新的用户界面进行了大量重构,这些改进都是基于收到的宝贵反馈而实现的。官方还实施了性能增强措施,使得Maven导入更快,并且在打开项目时IDE功能更早地可用。由于后台提交检查,新版本提供了简化的提交流程。IntelliJIDEA
你好,Stackoverflow的人们,我经营一个网站,为用户寻找最便宜的书籍购买地点。这对于单本书来说很容易,但对于多本书来说,有时在一家商店购买一本书而在另一家商店购买另一本书会更便宜。目前我找到了销售用户列表中所有书籍的最便宜的商店,但我想要一个更智能的系统。这里有更多信息:一本书的价格对于一家商店来说是不变的。运费可能会有所不同,具体取决于书籍的数量或书籍的总值(value)。每个商店对象都可以获取一组书籍并返回运费。通常,并非每家书店都出售每一本书。不确定在这里链接到我的站点是否很酷,但它列在我的用户配置文件中。我希望能够找到最便宜的商店和书籍组合。我担心这需要一种蛮力方法-
我正在运行RubyonRails3,我想使用Paperclip插件/gem降低上传图像的质量。我该怎么做?此时在我的模型文件中我有:has_attached_file:avatar,:styles=>{:thumb=>["50x50#",:jpg],:medium=>["250x250#",:jpg],:original=>["600x600#",:jpg]}这会将图像转换为.jpg格式并设置尺寸。 最佳答案 尝试使用convert_options。has_attached_file:avatar,:styles=>{:thumb=
警告:找不到RubyGems1.2+索引:RubyGems将恢复到降低性能的遗留索引。如果有人能帮我解决这个问题,我会给他们50.00美元我用尽了谷歌,重新安装了所有东西。我只想做gem安装...就是这样 最佳答案 删除罪魁祸首URL。就我而言,我使用的是Centos5.4,我收到的完整错误消息是:root#geminstallrackWARNING:RubyGems1.2+indexnotfoundfor:http://rubyworks.rubyforge.org/redhat/5/GEMS/x86_64/RubyGemswil
背景我最近发布了ananswer我在不同的地方将#{}称为文字、运算符和(在一个草案中)“文字构造函数”。这个定义的模糊性并没有真正影响答案的质量,因为问题更多是关于它的作用以及如何找到它的语言引用,但我对无法准确指出规范定义感到不满怎么称呼这个Ruby语法元素。Rubymanual在关于expressionsubstitution的部分中提到了这个语法元素,但并没有真正定义语法本身的术语。几乎所有对该语言元素的引用都说它用于字符串插值,但没有定义它是什么。维基百科定义这里有一些维基百科定义暗示这个结构(严格来说)既不是文字也不是运算符。Literal(computerprogramm
高科技摄像头特别是海康萤石摄像头,已经不再只局限于简单的视频功能,特别是智能AI的普及,摄像头也华丽变身成了一个个独立的智能个体,可以实现人脸抓拍,人形检测,客流统计等店铺值守场景,也可以实现安全帽识别,车辆识别,非法入侵识别等智慧工地场景。但用户也许会问,摄像头又不会说话,他得知的这些信息怎么告诉我们,还是说需要配一个主机去处理,这成本又有点太高了。这点正是萤石云要为大家解决的,下面来介绍下如何让设备更简便智能的说话。API(应用程序编程接口)提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力。形象一点API可以理解为一个管道,通过该管道,可以传入约定好的命令,来获得摄像头的反馈,
我最近意识到,如果您并置一系列Ruby字符串文字(例如'a'"b"'c'),则相当于这些字符串文字的串联。但是,我无法在任何地方找到这种语言功能的文档。我使用术语“并置”和“串联”进行了搜索,但只在几个StackOverflow响应中找到了对它的引用。谁能给我指出一个明确的引用? 最佳答案 更新这是nowofficiallydocumented在Ruby附带的RDoc中。更改将传播到RubyDoc下次他们构建文档时。添加的文档:Adjacentstringliteralsareautomaticallyconcatenatedbyt
2023年4月20 日,DatabendCloud经历了近两年的打磨终于发布了!🎉此次发布会由北京数变科技有限公司【DatabendLabs】联合阿里云共同举办。DatabendCloud借助于云原生数仓Databend实现了云简单易用的大数据分析场景。以下内容来自Databend联合创始人-王吟、DatabendCloud平台负责人-李亚舟以及阿里云智能资深产品运营专家-蔡亮伟,在本次发布会上的分享总结。🙋本次发布会分为三个部分:第一部分:王吟,李亚舟分享:「 云上数据变革,DatabendCloud发布」第二部分:蔡亮伟分享:「阿里云对象存储OSS, 构建企业级数据湖底座」第三部分:在阿里
本文来自明道云资深研发经理孙伟,在明道云2022年秋季伙伴大会活动演讲,经校对编辑后整理为演讲精华。一、开放没有选择很多客户选择我们的一个重要原因,是明道云所能提供的产品开放能力。开放其实是没有选择的,坦白来讲,我也不希望开放,我希望客户所有的业务系统都用明道云管理,这样对我们是更有利的。但是,现实中因为企业业务的多样性与复杂性,没有任何一家平台可以做到一站式解决所有问题。为了方便客户,我们就必须开放自己,让客户用得更好。1.一个典型的业务场景需要多少个系统?我们先来看一个典型的业务场景。一个客户从网站上下了一个订单,经销商收到订单之后去向企业订货。企业订货之后如果自身不进行生产,就需要向供应
每个企业都希望在完成项目后获得盈利,但不少企业到了年终后才发现项目做了不少,公司却并没能达到预期,甚至还出现了亏损。那么钱究竟去了哪里?很多公司都搞不清楚原因,出现糊涂账较多的状况,这将会造成严重的后果,尤其在疫情影响下,大环境很恶劣,如果是大公司的事业部门出现亏损,就可能会导致事业部门解散;如果是小公司出现亏损,就很容易导致公司倒闭;怎样做才能确保我们所完成的项目都能获利?从财务角度看,要确保盈利必须做到合理估算成本,只有这样才能在对外签订合约时做出合理报价,在对内在开始项目前做出充分评估投入代价,同时在实施过程中还要控制成本得当,最后项目结束时才会有可能获得盈利。那么我们怎样才能准确的判断