当前位置:首页 > AI技术 > 正文内容

WorkBuddy 怎么DeepSeek WorkBuddy 接DeepSeek模型教程最佳践|Duuu笔记

admin2个月前 (04-04)AI技术53

在生产环境中优化AI,本文分析

需完成模型适配、API桥接与配置验证三类操作:一、部署DeepSeek模型并暴露HTTP接口;二、在WorkBuddy AI中配置OpenAI兼容的自定义模型参数;三、调整提示词模板与消息分隔符;四、启用流式传输以保障多轮对话上下文;五、通过Nginx反向代理清洗非标准响应。

如果您希望在WorkBuddy AI中接入DeepSeek模型以实现本地化或私有化的大语言模型调用,则需完成模型适配、API桥接与配置验证三类核心操作。以下是具体实施步骤:

一、确认DeepSeek模型部署环境

WorkBuddy AI本身不内置DeepSeek模型,需先在本地或服务器端完成DeepSeek-R1或DeepSeek-Coder等对应版本的模型加载与服务暴露。该步骤确保后续WorkBuddy AI能通过标准HTTP接口访问推理能力。

1、从DeepSeek官方GitHub仓库下载指定版本的模型权重文件(如

deepseek

-

ai

/

deepseek

-coder-1.3b-base)。

2、使用vLLM、llama.cpp或Transformers+FastAPI搭建推理服务,启动后监听端口如http://127.0.0.1:8000/v1/chat/completions。

3、使用curl命令验证服务可用性:

curl -X POST http://127.0.0.1:8000/v1/chat/completions -H "Content-Type: application/json" -d '{"model":"

deepseek

-coder-1.3b","messages":[{"role":"user","content":"Hello"}]}'

二、配置WorkBuddy AI的自定义LLM接入参数

WorkBuddy AI支持通过“设置→AI模型→添加自定义模型”路径注入外部大模型API,需严格匹配OpenAI兼容接口规范,否则将触发404或500错误。

1、打开WorkBuddy AI客户端,进入【设置】菜单,点击【AI模型】选项卡。

2、点击右下角【+ 添加模型】按钮,在弹出表单中填写:模型名称填

DeepSeek-Coder-1.3b

,API基础地址填

http://127.0.0.1:8000/v1

,API密钥留空(若服务未启用鉴权)。

3、在“模型ID”字段中输入与推理服务返回header中一致的模型标识,例如

deepseek

-coder-1.3b-base

,该值必须与vLLM启动时--model参数完全相同。

三、替换系统默认提示词模板

DeepSeek模型对system角色指令敏感度高于Llama系列,若沿用默认模板可能导致响应格式错乱或拒绝生成。需手动调整prompt schema以匹配DeepSeek训练时的对话结构。

1、在模型配置页点击【高级设置】展开区域。

Zeemo

提供视频字幕、字幕制作和字幕翻译服务

下载

2、将“系统提示词模板”字段内容替换为:

You are a helpful programming assistant based on DeepSeek-Coder. Respond only in English unless explicitly asked for another language.

3、将“用户/助手消息分隔符”设为

\n\n

,禁用“添加system角色到请求体”选项(因部分DeepSeek部署不支持system字段)。

四、测试多轮对话上下文保持能力

DeepSeek-R1具备较强长上下文理解能力,但WorkBuddy AI默认会截断超过4096 token的历史记录。需手动启用流式传输与增量缓存机制保障对话连贯性。

1、新建一个代码分析任务窗口,输入问题:“请分析以下Python函数是否存在内存泄漏风险”,随后粘贴一段含闭包与全局变量的代码。

2、发送后观察响应延迟与token计数器,若显示

streaming: true

且响应分块返回,则说明WebSocket连接已生效。

3、紧接着追加提问:“基于刚才的分析,给出修复建议并重写函数”,验证历史上下文是否被正确注入至新请求的messages数组中。

五、处理常见响应解析异常

当WorkBuddy AI收到DeepSeek服务返回的非标准JSON(如含ANSI颜色码、多余换行或字段名大小写不一致)时,前端会抛出parse error。此时需在反向代理层做标准化清洗。

1、在Nginx配置中添加location /v1/段落,启用proxy_pass转发至本地vLLM服务,并插入header过滤规则。

2、添加sub_filter指令移除响应体中的控制字符:

sub_filter '\x1b\[.*?m' '';

3、启用json_filter模块,强制将response body中所有key转为小写,确保WorkBuddy AI解析器可识别choices、message、content等字段。

相关文章

推荐10个AI人工智能技术网站

除了研究和开发人工智能技术,OpenAI还积极参与人工智能伦理和安全的研究和探讨。 认为,人工智能技术的发展必须遵循伦理和法律的规范,以确保人工智能的应用不会对人类带来负面影响。...

几种主要的神经网络

卷积神经网络的输入为二维的像素整阵列,输出为这个图片的属性,当网络训练学习后,所输入的图片或许经过稍微的变换,但卷积神经网络还是可以通过识别图片局部的特征而将整个图片识别出来。 :该层...

bp神经网络是什么网络,神经网络和bp神经网络

1、前馈神经网络:一种最简单的神经网络,各神经元分层排列。每个神经元只与前一层的神经元相连。接收前一层的输出,并输出给下一层.各层间没有反馈。 2、BP神经网络:是一种按照误差逆向传播...

前端开发高级应用:Minimax视频生成提示词中文还是英文好实战案例|Duuu笔记

优先使用英文提示词,因其更契合模型训练语料并能稳定触发视觉特征;其次可采用中英混合策略兼顾文化专有名词;纯中文适用于强本土化场景;最终需通过多指标对比验证最优语言形式。 ☞☞☞AI 智能聊天, 问答...

深入理解前端开发:Minimax视频生成黑科技:复杂动作模拟完全指南|Duuu笔记

为精准模拟复杂动作,需采用分帧提示词构建、骨骼关键点引导注入和多阶段动作蒸馏三法:一、将动作拆解为带空间姿态的关键帧序列并加物理约束;二、注入2D/3D关键点坐标锚定关节位置;三、通过粗生成→特征提取...

深入理解前端开发:零基础教程:怎么用 Gemini 自动生成短视频脚本与拍摄大纲完全指南|Duuu笔记

需明确输入指令、理解输出逻辑并合理拆解内容:一、构建含角色/任务/格式等要素的提示词;二、追加分镜与时间轴约束优化专业性;三、转译为带道具编号与颜色标记的执行清单;四、用Gemini校验注意力断点并迭...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。