LobeChat是一个高性能的ChatGPT对话框架,其底层由OpenAI官方API提供AI服务。LobeChat拥有精致的UI设计和现代化的用户交互逻辑,同时注重隐私安全:所有对话内容均保留在使用端本地,服务器仅做数据处理转发,不做数据留存。
一、快速开始(电脑端和手机端均为网页登录)
1、激活应用使用权限
LobeChat支持两种灵活的计费方式:“包月使用(月卡)” 和 “按量计费(API Key)”
API Key和月卡在LobeChat的使用功能上无区别,只是计费方式不同。
(1)购买月卡后登录激活:
首先在lobehub.top登录你的月卡账号,随后提交一个提问,即可快速输入账号的激活码
(注意:月卡仅支持同时在线使用设备为 “1”个,若存在多个ip在线,系统将会对该月卡进行封控。若你需要更换使用设备,请在关闭页面后等候 “10分钟” 再登录。API Key无使用设备限制。)
(2)购买API Key后激活:
在lobehub.top点击使用API Key,随后提交一个提问,即可快速输入API Key
在Key额度查询输入你的API Key即可查询额度和使用明细
2、开始对话
(1)对话设置(仅对当前助手生效)
在每个聊天对话窗口输入框上方均可选择下次对话所使用的模型:
在模型选择按钮后方依次为:随机性设置、对话记录设置、语音输入按钮、插件设置、当前模型最大Tokens数
随机性:数值越大回复越随机,想象力和发散性越强;数值越低越严谨。推荐数值:0.6
对话记录设置:默认为不限制,即携带所有对话记录。当对话记录过长导致模型最大Tokens额度不足时建议调整为:10条。在使用gpt-4-v、gpt-4-dalle、-gpt-4-all模型时,建议调整数值为:5条。
语音输入:GPT将识别语音将其转换为文字。需要给予浏览器使用设备麦克风的权限,在移动设备使用更方便。
当前模型最大Tokens数:每个模型支持的上下文长度不一,目前数值最大的是gpt-4-1106-preview。当tokens额度不足时,请调整对话记录设置、在设置中开启历史记录压缩,或新建聊天
当模型选择为vision视觉模型时,将自动增加图片上传按钮,支持截图、复制粘贴以上传图片
(2)聊天记录
对话的聊天记录将会展示在对应助手对话页面的右侧边栏
和GPT每次对话讨论产生的聊天记录均以 “话题” 的形式保存在浏览器本地,你可以对任意对话记录进行 “编辑、收藏、复制、删除” 等操作,建议定期导出重要的聊天记录、删除不需要的对话记录,提高浏览器加载性能。
点击右下角发送旁边的按钮,即可创建新的对话(话题)
点击右上角 “分享” 按钮,即可生成当前对话记录的图片或链接。将有趣的、重要的对话保存为图片分享出去吧~
3、全局设置
(1)数据快速导入导出
在其他设备的助手预设、聊天记录等内容,支持一键导入导出到新设备:
导出数据后,将生成的xxxx.json文件发送给新设备;点击导入,选择对应的xxxx.json文件即可
(2)系统设置
在此设置页面中,可以对系统主题等常量进行统一设置
需要注意的是:在对模型参数进行调整修改时,部分参数的调整会有冲突,若修改后出现回复异常的情况,请重置设置参数。(目前设置参数较为合理,一般不建议调整参数)
二、特性一览(图片分析、语音交互、绘画、Code interperter等功能)
1、图片识别与分析(视觉认知)
LobeChat已支持GPT和Google的视觉认知模型,模型名分别为:gpt-4-vision-preview 和 gemini-pro-vision ,-vision是一个具备视觉识别能力的多模态智能。 用户可以轻松上传图片或者拖拽图片到对话框中,助手将能够识别图片内容,并在此基础上进行智能对话,构建更智能、更多元化的聊天场景。在识别能力上这两款模型不分伯仲,用户可以按需切换使用。
这一特性打开了新的互动方式,使得交流不再局限于文字,而是可以涵盖丰富的视觉元素。无论是日常使用中的图片分享,还是在特定行业内的图像解读,助手都能提供出色的对话体验。
视觉模型可以对任何图片进行内容分析,当然,如果需要更优质的回答,你需要尽可能得优化你的提问内容描述,让AI更加理解你的需求。
2、语音交互(TTS & STT语音交互)
LobeChat 支持文字转语音(Text-to-Speech,TTS)和语音转文字(Speech-to-Text,STT)技术,我们的应用能够将文本信息转化为清晰的语音输出,用户可以像与真人交谈一样与我们的对话代理进行交流。 用户可以从多种声音中选择,给助手搭配合适的音源。 同时,对于那些倾向于听觉学习或者想要在忙碌中获取信息的用户来说,TTS 提供了一个极佳的解决方案。
在 LobeChat 中,我们精心挑选了一系列高品质的声音选项 (OpenAI Audio, Microsoft Edge Speech),以满足不同地域和文化背景用户的需求。用户可以根据个人喜好或者特定场景来选择合适的语音,从而获得个性化的交流体验。
语音输入:点击输入框上方工具栏中的 “语音” 按钮即可
语音输出:在需要转换成语音的消息右侧点击 “语音朗读” 即可,语音文件支持下载。
音色调整:在设置页面中找到 “语音服务” ,按需修改
3、AI绘画
AI绘画在人工智能时代中的重要性日益增加,它为艺术家提供了全新的创作手段,推动了艺术界的创新。这不仅能够激发专业人士的创造力,还可以让非专业人士体验到创造独特艺术作品的乐趣。在教育领域,AI绘画作为交互式学习工具,促进了学生对艺术的理解和兴趣。工业设计师通过AI快速迭代设计方案,提高工作效率。此外,AI绘画还为娱乐产业提供丰富的视觉内容,其对未来艺术和创意产业的贡献不可估量。
(1)GPT提供的Dall-e-3模型
简介:能够通过自然语言描述进行创作。GPT将根据用户描述自行生成、修改调整绘画Prompt,使用易上手,快速实现各种天马行空的想法!
(2)Stable Diffusion
简介:通过精确的Prompt描述可以精准控制图片细节,适合专业人士使用,上手难度稍高。
4、Code interperter(代码编写与代码解释器)
ChatGPT的代码解释器(Code Interpreter)功能能够让这个基于AI的聊天机器人理解和执行编程代码。这意味着用户可以给ChatGPT提供代码片段,并请求它来解释代码的功能、执行代码、调试代码或解释代码的输出。这个特性对于学习编程、解决编程问题、或者是简单地对代码感到好奇的人来说非常有用。
(1)代码编写
GPT-4的代码编写能力得到了进一步的提升,配合良好的预设Prompt,往往能取得事半功倍的效果,大大提升了专业人士的编程效率;同时降低了初学者的使用门槛,GPT可以担任一个专业、耐心的老师。
(2)Code interperter
利用gpt-4-all模型实现Code interperter,示例如下:
(值得注意的是,ChatGPT的能力可能受限于其训练时的数据集和环境。它可能无法执行所有类型的代码,特别是在涉及到外部API调用、需要特殊环境的代码或者是非常复杂的程序时。此外,ChatGPT的执行环境是模拟的,它不会真正地在服务器上运行用户代码,而是依据其训练数据来预测代码的执行结果。因此,对于复杂和敏感的编程任务,ChatGPT的输出应该仅仅被视作参考,并且需要在安全的环境中通过实际的编译和执行来验证。)
三、什么是助手?(打造私人AI助理)
“助手”概念类似于GPTs,通过提前对GPT进行预设引导,或绑定插件,便于用户二次使用。通过良好的预设优化,你可以为自己打造多个专属的AI助手。每个 “助手” 都可以新建若干个 “话题” ,每个 “话题” 都是和 “助手” 的新一轮聊天对话, “话题” 记录将会保留在每个 “助手” 聊天框的右侧边栏。
在LobeChat页面左侧为“助手”列表。一个助手往往代表着精炼的预设提示词和模型、插件预设。例如模仿ChatGPT官网的预设助手:
针对不同的需求,你可以自由创建多个助手,例如专门为图像识别进行预设的助手、为论文优化的助手、负责软件开发的助手、营销分析的助手等等,给与不同的助手设置不同的预设提示词,方便日常快速使用。在左上角 “发现” 页面中,我们会不定期更新一些新的实用助手,方便用户快捷使用。
由于所有聊天记录均保留在浏览器中,建议定期对重要对话进行导出,避免聊天数据意外丢失。
四、扩展插件(基于LangChain实现的插件功能)
LobeChat 的插件生态系统是其核心功能的重要扩展,它极大地增强了 ChatGPT 的实用性和灵活性。通过利用插件,ChatGPT 能够实现实时信息的获取和处理,例如自动获取最新新闻头条,为用户提供即时且相关的资讯。 此外,这些插件不仅局限于新闻聚合,还可以扩展到其他实用的功能,如快速检索文档、获取电商平台数据、以及其他各式各样的第三方服务。
首次使用插件功能时,需在 “插件商店” 中下载所需的插件。在对话过程中如需使用插件,勾选启用对应的插件即可。(需要用哪个插件就勾选哪个,避免出现未知bug导致对话异常)
例如使用 “思维导图” 插件:
目前插件功能还在不断优化完善,未来将会提供更多丰富实用的功能型插件,敬请期待~