成本降低90%,OpenAI正式开放ChαtGΡΤ
今天凌晨,OpenAI官方發布ChαtGΡΤ和Whisper的接囗,開發人員現在可以通過API使用最新的文本生成和語音轉文本功能。OpenAI稱:通過一系列系統級優化,自去年12月以來,ChαtGΡΤ的成本降低了90%;現在OpenAI用這些節省下來的成本造福廣大開發者。開發人員現在通過API使用Whisper v2大模型,從而獲得更快的速度和更經濟成本。ChαtGΡΤ模型會不斷得到升級改進,并提供專用容量來對模型進行更深入的控制。
文章目錄
- ChαtGΡΤ接囗
- 模型
- 接口
- 最佳實踐
- Whisper接囗
- transcribe
- translate
ChαtGΡΤ接囗
模型
OpenAI發布的ChαtGΡΤ模型名稱為gpt-3.5-turbo,它與ChαtGΡΤ產品中使用的模型相同。價格0.002美元/1000 token,比之前的text-davinci-003便宜10倍。gpt-3.5-turbo在聊天場景下表現經驗,許多非聊天場景應用也可以表現優秀,開發者只需要極少調整就可以將模型由text-davinci-003切換到gpt-3.5-turbo。
OpenAI會不斷改進 ChαtGΡΤ 模型,因此gpt-3.5-turbo模型會不斷更新(4月會升級到最新穩定版本),OpenAI也推薦大家使用gpt-3.5-turbo模型。為了滿足開發者對特定模型版本的需求,OpenAI還提供了特定快照版。目前提供的特定快照版為gpt-3.5-turbo-0301,該版本在接下來的三個月內不更新,有效期到2023年6月1日。
| gpt-3.5-turbo | 功能最強大的 GPT-3.5 模型,并針對聊天場景進行了專門優化,成本僅為 text-davinci-003 的 1/10。 會不斷迭代更新。 | 4,096 tokens | 截至2021年6月 |
| gpt-3.5-turbo-0301 | gpt-3.5-turbo的2023年3月1日快照版本。此模型在加下來3個月內不會更新,有效期截止2023年6月1日。 | 4,096 tokens | 截至2019年10月 |
接口
由于gpt-3.5-turbo為聊天而場景設計,所以接口設計上發生了一點變化。在GPT-3接口中,問題是通過prompt字段傳入的,gpt-3.5-turbo沒有prompt字段,取而代之的是messages數組。下面是一個典型的接口調用例子:
import openaicompletion = openai.ChatCompletion.create(model="gpt-3.5-turbo",messages=[{"role": "system", "content": "你是一個聰明的助理"},{"role": "user", "content": "哪支球隊贏得了2018世界杯?"},{"role": "assistant", "content": "法國國家男子足球隊獲得2018年俄羅斯世界杯。"},{"role": "user", "content": "決賽對手是誰?"}] ) print(completion)上面示例代碼中,我們將多輪對話封裝到messages數組中,每條消息都有role和content。role的可選值為system, user, assistant,content是消息內容。
通常,對話的格式首先是system消息,然后是交替的user消息和assistant消息。
system消息有助于設置模型的行為。在上面的例子中,模型被告知“你是一個聰明的助理”,模型就會扮演一個助理角色,輸出的內容會盡可能像一個助理一樣簡潔清晰。
user消息有助于指導模型。它即可以是用戶的問題(通常是最后一條),也可以是開發人員的指令設置或上下文提示。
assistant消息有助于存儲上下文。它即可以是模型之前的輸出,也可以由開發人員編寫,用于給出所需行為的示例。
由于模型沒有過去請求的記憶,所以必須通過對話提供所有相關信息。因此包含歷史回話有助于模型更好理解問題。上面實例中,如果沒有中間的user消息和assistant消息,單獨問模型"決賽對手是誰?"模型是很難給出正確回答的。
gpt-3.5-turbo的返回數據格式也稍有變化。GPT-3接口的輸出封裝在text字段中,gpt-3.5-turbo的輸出封裝在message字段中,并且同樣由role和content構成。我們可以簡單地通過completion['choices'][0]['message']['content']獲取輸出。
最佳實踐
由于gpt-3.5-turbo的表現與text-davinci-003類似,但價格是text-davinci-003的1/10,因此官方建議在大多數使用情況下使用gpt-3.5-turbo。
對于開發者來說,需要改動的地方很少,只需要將prompt改為messages格式即可。
"prompt": "哪支球隊贏得了2018世界杯?"改為:
messages: [{"role": "system", "content": "你是一個聰明的助理"},{"role": "user", "content": "哪支球隊贏得了2018世界杯?"} ]或者更簡單地改為:
messages: [{"role": "user", "content": "哪支球隊贏得了2018世界杯?"} ]?注意:gpt-3.5-turbo和gpt-3.5-turbo-0301不支持微調。
Whisper接囗
Whisper是OpenAI于2022年9月開源的語音轉文本模型,推出后獲得開發者社區的極大贊譽。現在我們可以通過API調用Whisper v2模型,價格為0.006美元/分鐘。與其他服務相比,高度優化的服務堆棧可確保Whisper具有更快的性能。
Whisper API提供transcribe 和 translate接口,支持多種音頻格式(m4a、mp3、mp4、mpeg、mpga、wav、webm)。
transcribe
import openaiaudio_file= open("/path/to/file/audio.mp3", "rb") transcript = openai.Audio.transcribe("whisper-1", audio_file)translate
import openaiaudio_file= open("/path/to/file/audio.mp3", "rb") transcript = openai.Audio.translate("whisper-1", audio_file)Whisper目前支持南非荷蘭語、阿拉伯語、亞美尼亞語、阿塞拜疆語、白俄羅斯語、波斯尼亞語、保加利亞語、加泰羅尼亞語、中文、克羅地亞語、捷克語、丹麥語、荷蘭語、英語、愛沙尼亞語、芬蘭語、法語、加利西亞語、德語、希臘語、希伯來語、印地語、匈牙利語、冰島語、印度尼西亞語、 意大利語、日語、卡納達語、哈薩克語、韓語、拉脫維亞語、立陶宛語、馬其頓語、馬來語、馬拉地語、毛利語、尼泊爾語、挪威語、波斯語、波蘭語、葡萄牙語、羅馬尼亞語、俄語、塞爾維亞語、斯洛伐克語、斯洛文尼亞語、西班牙語、斯瓦希里語、瑞典語、他加祿語、 泰米爾語、泰語、土耳其語、烏克蘭語、烏爾都語、越南語和威爾士語。
支持中文!支持中文!支持中文!
總結
以上是生活随笔為你收集整理的成本降低90%,OpenAI正式开放ChαtGΡΤ的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 讨嫌
- 下一篇: Hutool工具类之ExcelUtil