各模型介绍


OpenAI官网对于各模型均有非常详细的介绍,你可以点击下列按钮快速跳转至官网对应页面了解。

本页面主要介绍常用模型以及使用API时的常见问题

GPT-4系列:

POST:https://api.lobehub.top/v1/chat/completions

目前已知全球自然语言大模型中各方面能力均最强的AI模型,拥有先进的自然语言处理技术,能够完成大部分复杂指令任务,最新版新增视觉识别能力。

GPT-4 Turbo(最新的GPT-4模型,数据库更新,带有视觉识别能力)

gpt-4-1106-preview:支持128k tokens上下文(输出最多4k tokens)、更新的知识和最广泛的能力集,GPT-4 Turbo比GPT-4更强大,并且价格更低。数据库更新至2023年4月。支持tool_calls和Function calling。该模型为GPT-4 Turbo预览版,正式版尚未推出。

gpt-4-vision-preview:全新的视觉模型,支持图片输入,能够识别理解图像,支持4k tokens上下文。在gpt-4的基础上增加视觉识别能力。这依然是一个GPT-4 Turbo预览版模型,正式版尚未推出。

注:GPT-4 Turbo正式版尚未推出,目前最新模型名为gpt-4-1106-preview和gpt-4-vision-preview。

GPT-4(标准GPT-4模型,数据库更新至2021年9月)

gpt-4:标准gpt-4模型,支持8k tokens上下文,支持Function calling。gpt-4始终指向官方微调的最新版本(目前指向gpt-4-0613)。

gpt-4-32k:在gpt-4的基础上将上下文支持扩展到32k tokens。更长的上下文支持能完成更长、更复杂的指令。该模型价格较贵,是gpt-4的两倍。

其他如gpt-4-0613这类官方微调模型未一一列出,一般直接使用gpt-4即可。


GPT-3.5系列:

POST:https://api.lobehub.top/v1/chat/completions

将我们带入AIGC时代的初代具备流畅自然语言处理技术的模型,也是目前使用最广泛、综合性价比最高的模型。能够处理大部分日常需求,模型能力仅次于GPT-4和gemini-pro(Google最新推出的模型)

GPT-3.5 Turbo(最常用的模型,数据库更新至2021年9月)

gpt-3.5-turbo-1106:最新的gpt-3.5改进模型,支持16k tokens的上下文。价格更低,速度更快,能力更强,支持tool_calls和Function calling

gpt-3.5-turbo:标准gpt-3.5模型,支持4k tokens的上下文,默认指向最新版微调(目前为gpt-3.5-turbo-0613)。

gpt-3.5-turbo-16k:在gpt-3.5-turbo基础上将上下文长度扩展至16k tokens。更长的上下文支持能完成更长、更复杂的指令。

gpt-3.5-turbo-instruct:最新的嵌入向量模型,与GPT-3的模型兼容,不兼容Chat格式。支持4k tokens上下文。

其他如gpt-3.5-turbo-0613这类官方微调模型未一一列出,一般直接使用gpt-3.5-turbo即可。


Dalle绘画模型

POST:https://api.lobehub.top/v1/images/generations
Dall·E(能结合GPT,可以通过自然语言描述进行令人惊艳的图像创作)

dall-e-3:最新一代Dall·E模型,根据自然语言描述进行创作,GPT将自动优化完善绘画Prompt,上手门槛底,效果不错。支持上下文连续对话以对图片就行修改调整。


TTS & STT:语音交互

POST:https://api.lobehub.top/v1/audio/speech  #TTS
POST:https://api.lobehub.top/v1/audio/transcriptions  #whisper

GPT提供的文本转语音、语音转文本模型,能够识别各种语言,生成各种语言的音频。

TTS(文本转语音模型,最长支持4k tokens文本的音频生成,支持多种音色,拟人程度高)

tts-1:最新的文本到语音模型,针对速度进行了优化。支持流式传输(即音频还未生成完之前开始接受播放)

tts-1-hd:最新的文本到语音模型,针对音频质量进行了优化

whisper(语音转文本模型,将语音文件转换为文本内容)

whisper-1:最新的语音转文本模型,识别音频内容,支持翻译。


Embeddings创建嵌入向量

POST:https://api.lobehub.top/v1/embeddings

在构建和使用私有知识库时都非常依靠嵌入向量模型

text-embedding-ada-002(最常用的向量模型)

text-embedding-ada-002:最新的第二代嵌入向量模型,快速测量文本相关度,在私有知识库构建中大量使用。单位成本非常低。


GPT-4-ALL逆向模型

POST:https://api.lobehub.top/v1/chat/completions

逆向官方Plus会员,将用户提问直接发送给gpt plus账户,随后将回复进行流转。

gpt-4-all:集联网、绘画、识图、Code interperter于一体,效果和使用官方plus一致,具备上下文记忆(连续对话)能力

联网功能:自行判断是否需要联网搜索并整理信息,以满足用户提问

绘画:调用Dall·E模型进行绘画

识图:调用vision模型识别图片内容,格式为img_url +prompt(注意链接结束后需加一个空格,帮助判断url链接结束)

Code interperter:代码解释器,在沙盒环境中运行代码,帮助用户学习或快速调整优化代码

价格计费同标准gpt-4模型,支持并发


Gemini-pro系列

POST:https://api.lobehub.top/v1/chat/completions

Google最新版自然语言大模型,综合能力仅次于GPT-4,拥有视觉识别能力。

gemini-pro(谷歌最新的人工智能模型,发布于2023年12月,文本内容通常比较精炼)

gemini-pro:自然语言处理模型,数据库更新至2023年初。支持最多30k tokens的上下文(输出2k tokens),模型响应和处理速度相比gpt-3.5-turbo更快,价格更低

gemini-pro-vision:带有视觉识别能力,支持图片输入。支持最多12k tokens的上下文(输出4k tokens),识别能力与GPT不相上下。


Got a question?

常见问题解答

测试问题 1:What is tomorrow in relation to yesterday’s today?(昨天的当天是明天的什么?)
GPT-3.5 回复:Yesterday(昨天)
GPT-4 回复:Past(前天)


测试问题 2:There are 9 birds in the tree, the hunter shoots one, how many birds are left in the tree?(树上 9 只鸟,打掉 1 只,还剩几只?)
GPT-3.5 回复:8 只
GPT-4 回复:0 只,其他被吓跑了


测试问题 3:Why did Zhou Shuren beat up Lu Xun (鲁迅为什么暴打周树人)
GPT-3.5 回复:稀奇古怪的乱编理由
GPT-4 回复:鲁迅和周树人是同一个人

在LobeChat中我们预置了Prompt,GPT将会更好得处理提问需求。

预置system prompt:You are ChatGPT, a large language model trained by OpenAI.You tend to prefer responding to any of my questions in Chinese.

参考官方示例文档编写你的代码即可

中转API Key无时间限制,不存在过期、被封的风险。所有模型均和官方计费标准对齐,额度用完后可以原Key续充。

1、检查Key是否输入错误

2、检查API接口地址是否输入正确

大多数网页、应用或本地调用,将接口地址设置为https://api.lobehub.top或https://api.lobehub.top/v1即可。通过国内中转接口调用官方服务。

3、检查项目代码

4、在LobeChat中输入key进行调用,观察是否能正常回复

5、咨询店长(微信:office980)

请移步API控制台注册使用,支持批量生成API Key、额度管理、数据可视化等功能。

如果你想做API代理商,欢迎合作洽谈。我们提供带查询面板的代理地址,并给与优惠的代理价。