ChatGPT API接口使用+fine tune微调+prompt介绍

BGoodHabit 2023-04-22 原文

1 接口调用

我们可以用OpenAI 提供的API接口实现很多NLP的任务，还可以支持生成图像，提取embedding以及finetune的功能。接下来我们来看下具体怎么调用接口。

1.1 生成key

首先需要从网址：https://platform.openai.com/account/api-keys，生成我们的API key：

获得key后我们就可以调用API接口了。目前OpenAI 的 API 服务提供了一个免费的 API 计算单元 (ACU) 的额度，该额度可以用于测试和试用 OpenAI 提供的服务。免费的额度用完后，需要购买额外的 ACU 才能继续使用 OpenAI 的 API 服务。我们可以从Usage和Billing：https://platform.openai.com/account/usage 里去查看我们的免费额度以及进行额度充值：

1.2 接口功能

首先我们需要安装openai

pip install openai

安装好openai以及获得API key后，我们就可以调用接口了，首先我们来看下openai能够提供的模型有什么：

import openai
openai.api_key = "sk-Wljk3BVhN0VieGCwAzEXT3BlbkFJ*******"

models = openai.Model.list()

for model in models['data']:
    print(model['id'])

我们可以看出，目前提供的模型有如下：

接下来大概介绍一下我们应该怎样去调用接口，获取我们想要的结果。

1.2.1 图片生成 (image generation)

import openai
import json

# 设置API密钥
openai.api_key = "sk-Wljk3BVhN0VieGCwAzEXT3BlbkFJ*******"

def image_genaration(prompt):
    response = openai.Image.create(
    prompt=prompt,
    n=1,
    size="1024x1024"
    )
    image_url = response['data'][0]['url']
    return image_url

if __name__=='__main__':
    prompt='a delicious dessert'
    result = image_genaration(prompt)
    print(result)

prompt=‘a delicious dessert’, 其中返回url地址，我们将地址复制到浏览器中，打开看到如下图：

当prompt=‘母亲在厨房忙碌着’，OpenAI返回的效果图如下：

人物画像细节生成还不够逼真。来试一试中国的古诗词效果，
prompt=‘踏花归去马蹄香’

马蹄上应该画出一些蝴蝶🦋来表达马蹄的花香味啊，不太满意~😞

1.2.2 对话(chat)

api接口调用代码如下所示：

import openai
import json

# 设置API密钥
openai.api_key = "sk-Wljk3BVhN0VieGCwAzEXT3BlbkFJ*******"
def chat(prompt):

    response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "user", "content":prompt}
    ]
)
    answer = response.choices[0].message.content
    return answer

if __name__=='__main__':
    prompt='人口最多的国家'
    result = chat(prompt)
    print(result)

结果如下：

1.2.3 中文纠错 (Chinese Spelling Correct)

我们可以通过合理的写prompt，基于问答形式，让gpt-3.5做NLP任务。比如对中文纠错，我们可以这样写prompt，让chagpt能够做纠错NLP任务。如下所示：

def correct():
    prompt="改正错词输出正确句子:\n\n我在京东电商平台买了苹果耳几和华为体脂称"  #建议prompt: 改正错词输出正确句子:\n\n input_sentence
    response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "user", "content":prompt}
    ]
)
    answer = response.choices[0].message.content
    return answer

if __name__=='__main__':
    result = correct()
    print(result)

结果如下：

1.2.4 关键词提取（keyword extract)

def keyword():
    prompt="对下面内容识别2个关键词，每个词字数不超过3个字:\n\n齐选汽车挂件车内挂饰车载后视镜吊坠高档实心黄铜玉石出入平安保男女 红流苏-玉髓平安扣"  #建议prompt: 对下面内容识别n个关键词，每个词字数不超过m个字:\n\n input data
    response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "user", "content":prompt}
    ]
)
    answer = response.choices[0].message.content
    return answer

if __name__=='__main__':
    result = keyword()
    print(result)

对于不同的prompt，输出的结果差异也较大。所以对于具体的任务场景，我们需要尝试不同的prompt, 根据结果的反馈，不断的调整和优化prompt，从而得到更加准确的结果。

1.2.5 抽取文本向量 (Embedding)

def embedding():
    content = '苹果手机'
    response = openai.Embedding.create(
    model="text-embedding-ada-002",
    input=content
)
    answer = response.data[0].embedding
    return answer

if __name__=='__main__':
    result = embedding()
    print(len(result))
    print(result)

得到结果如下：

是一个1536维度的向量，我们可以基于文本的向量去做很多任务，比如计算两个向量的余弦值，计算相似性分值等。

1.2.6 微调 (fine tune)

openAI提供了接口可以用我们自己的数据进行fine tune，得到适应我们自己业务场景的新模型。假如我们需要训练一个适应我们自己领域知识的聊天机器人，我们可以按照下面流程来做fine tune。

数据准备

我们可以先把数据转成csv格式，需提供prompt列和对应的completion列，其中prompt相当于问题，completion就是对应的答案，如下是我们要用来fine tune模型的result.csv训练样本内容显示：

然后我们可以用openAI提供的数据处理工具对数据转成json格式的文件

openai tools fine_tunes.prepare_data -f result.csv

执行完后，我们会得到一个对应的json文件：result_prepared.jsonl

模型微调训练
接下来我们就可以用已有的模型 (ada, babbage, curie, davinci) 进行fine tune，官方给出的具体可以用来做微调的模型主要如下：

首先需要指定我们自己的API key：

export OPENAI_API_KEY="sk-Wljk3BVhN0VieGCwAzEX*********"

然后开始训练：

openai api fine_tunes.create -t result_prepared.jsonl -m ada

在这里用我们自己的数据result_prepared.jsonl，基于base model： ada模型提交fine tune任务。提交后会返回给我们一个JOB ID，通过这个job id我们可以跟进模型在远程服务器训练情况：

 openai api fine_tunes.follow -i ft-sWKDNnTmUyOGEdpvbAOvEaZt

我们可以看到结果如下：

可以看到我们的模型训练好了模型名称叫做：ada:ft-personal-2023-03-27-03-24-09，然后我们就可以试用我们训练好的模型看效果了，测试如下：

openai api completions.create -m ada:ft-personal-2023-03-27-03-24-09 -p <YOUR_PROMPT>

其中<YOUR_PROMPT>写入我们要测试的问题就好。

现在我们可以去远程服务器上查看下我们fine tune好的模型是否已经有了：

models = openai.Model.list()

发现有了刚刚fine tune的模型：

对于分类，实体识别等任务，OPNAI官网也提供了如何做处理数据，让模型做fine tune，详情可以参考官网https://platform.openai.com/docs/introduction/overview

2 如何写好prompt

prompt如何表达，对于chatgpt返回的答案会差异很大，通过prompt正确的表达问题，chatgpt才会返回更合适的结果。通过自己这些天的尝试以及官网给的提示，感受就是在写prompt时候，可以通过说明，例子，限制条件，修饰词等具体表达问题，这样chatgpt会给出更加精准的答案。接下来，我们对几种常见的任务，prompt应用如何写。

2.1分类任务

我们可以对prompt这么构造：
判断content属于A,B,C,D哪一种分类
content: detail
分类:

对应的查询结果如下：

2.2 归纳总结

提供了非常强大能力，能够基于学到的广泛知识，给出问题解决方案，合理的建议，实施步骤，商业计划，人物描写等等。所以我们可以合理写prompt，更有意思的答案。

哈哈，看起来不够大胆，于是进一步发问：

给出的这些答案果然更加激动人心。

3.3 翻译

我们可以将一种语言翻译成我们大多数其他语言。对于翻译任务，我们只需要写prompt表达我们的意愿就是：
将下面内容翻译成英语，日语，德语
content

2.4 API接口多样性控制

在调用API接口的时候，我们可以通过设置两个参数=='temperature’和’top_p’来控制生成文本的多样性和可控度==。当temperature较高时，生成的文本会更加随机和多样化，而当temperature较低时，生成的文本会更加保守和可控。top_p参数用于控制生成文本的可控度，它会限制模型生成文本时可以选择的token的数量。具体来说，当top_p越低时，模型只考虑概率分布中累计概率最高的一部分token，而忽略其他低概率的token。这样一来，生成的文本就更加可控，因为只有那些最可能的token才会被考虑。而当top_p越高的时候，生成的文本可能会更加灵活和多样，因为模型会考虑更多的低概率token。每次调用的时候，我们可以设置这两个参数：

3 实用资料

大模型训练平台：https://github.com/hpcaitech/ColossalAI
相关资料：中文精选资源清单

微调 ChatGPT span class token python 人工智能深度学习

有关ChatGPT API接口使用+fine tune微调+prompt介绍的更多相关文章

ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2
我正在学习如何使用Nokogiri，根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div
ruby - 使用 RubyZip 生成 ZIP 文件时设置压缩级别 - 2
我有一个Ruby程序，它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重，我想提高压缩级别，因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗？是否有另一个允许指定压缩级别的Ruby库？最佳答案这是我通过查看rubyzip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d
ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法？ - 2
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
ruby-on-rails - 使用 Ruby on Rails 进行自动化测试 - 最佳实践 - 2
很好奇，就使用rubyonrails自动化单元测试而言，你们正在做什么？您是否创建了一个脚本来在cron中运行rake作业并将结果邮寄给您？git中的预提交Hook？只是手动调用？我完全理解测试，但想知道在错误发生之前捕获错误的最佳实践是什么。让我们理所当然地认为测试本身是完美无缺的，并且可以正常工作。下一步是什么以确保他们在正确的时间将可能有害的结果传达给您？最佳答案不确定您到底想听什么，但是有几个级别的自动代码库控制:在处理某项功能时，您可以使用类似autotest的内容获得关于哪些有效，哪些无效的即时反馈。要确保您的提
ruby - 在 Ruby 中使用匿名模块 - 2
假设我做了一个模块如下:m=Module.newdoclassCendend三个问题:除了对m的引用之外，还有什么方法可以访问C和m中的其他内容？我可以在创建匿名模块后为其命名吗(就像我输入“module...”一样)？如何在使用完匿名模块后将其删除，使其定义的常量不再存在？最佳答案三个答案:是的，使用ObjectSpace.此代码使c引用你的类(class)C不引用m:c=nilObjectSpace.each_object{|obj|c=objif(Class===objandobj.name=~/::C$/)}当然这取决于
ruby - 使用 ruby 和 savon 的 SOAP 服务 - 2
我正在尝试使用ruby和Savon来使用网络服务。测试服务为http://www.webservicex.net/WS/WSDetails.aspx?WSID=9&CATID=2require'rubygems'require'savon'client=Savon::Client.new"http://www.webservicex.net/stockquote.asmx?WSDL"client.get_quotedo|soap|soap.body={:symbol=>"AAPL"}end返回SOAP异常。检查soap信封，在我看来soap请求没有正确的命名空间。任何人都可以建议我
python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声？ - 2
关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题？更新问题，以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点？我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等)，但我确实想创建一个输出文件。
ruby-on-rails - 'compass watch' 是如何工作的/它是如何与 rails 一起使用的 - 2
我在我的项目目录中完成了compasscreate.和compassinitrails。几个问题:我已将我的.sass文件放在public/stylesheets中。这是放置它们的正确位置吗？当我运行compasswatch时，它不会自动编译这些.sass文件。我必须手动指定文件:compasswatchpublic/stylesheets/myfile.sass等。如何让它自动运行？文件ie.css、print.css和screen.css已放在stylesheets/compiled。如何在编译后不让它们重新出现的情况下删除它们？我自己编译的.sass文件编译成compiled/t
ruby - 使用 ruby 将 HTML 转换为纯文本并维护结构/格式 - 2
我想将html转换为纯文本。不过，我不想只删除标签，我想智能地保留尽可能多的格式。为插入换行符标签，检测段落并格式化它们等。输入非常简单，通常是格式良好的html(不是整个文档，只是一堆内容，通常没有anchor或图像)。我可以将几个正则表达式放在一起，让我达到80%，但我认为可能有一些现有的解决方案更智能。最佳答案首先，不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案，它会随着HTML的变化而崩溃，或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h
ruby - 在 64 位 Snow Leopard 上使用 rvm、postgres 9.0、ruby 1.9.2-p136 安装 pg gem 时出现问题 - 2
我想为Heroku构建一个Rails3应用程序。他们使用Postgres作为他们的数据库，所以我通过MacPorts安装了postgres9.0。现在我需要一个postgresgem并且共识是出于性能原因你想要pggem。但是我对我得到的错误感到非常困惑当我尝试在rvm下通过geminstall安装pg时。我已经非常明确地指定了所有postgres目录的位置可以找到但仍然无法完成安装:$envARCHFLAGS='-archx86_64'geminstallpg--\--with-pg-config=/opt/local/var/db/postgresql90/defaultdb/po