DeepSeek Vision MCP Server
将 DeepSeek 网页版识图(Vision)模式封装为 MCP 工具,解决 DeepSeek 模型无法直接处理图像的问题。
安装
git clone <repo> && cd deepseek-vision-mcp
npm install && npm run build
使用
方式一:自动登录(推荐,桌面环境)
无需任何配置,直接启动:
npm start
首次启动时自动打开浏览器让您登录 DeepSeek,Token 自动保存到 ~/.deepseek-vision/config.json,后续自动复用。
Token 过期后会自动弹出浏览器重新登录。
方式二:手动配置(服务器环境)
在 .mcp.json 中设置环境变量:
{
"mcpServers": {
"deepseek-vision": {
"command": "node",
"args": ["/path/to/dist/index.js"],
"env": {
"DEEPSEEK_USER_TOKEN": "你的token",
"DEEPSEEK_SMIDV2": "你的smidV2(可选)"
}
}
}
}
Token 获取方法:https://chat.deepseek.com → F12 → Application → Local Storage → userToken → JSON.parse(value).value
MCP 工具
recognize_image
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
image |
string | ✅ | 图片文件路径(也支持 data URI) |
prompt |
string | ❌ | 提问(默认:请详细描述这张图片中的内容) |
recognize_image({ image: "/tmp/screenshot.png", prompt: "这张图是什么" })
项目结构
src/
├── index.ts # MCP Server 入口 + Skill 自动安装
├── deepseek-client.ts # API 客户端(上传/Fork/PoW/Completion)
├── auth-manager.ts # Puppeteer 自动登录 + Token 管理
├── pow-solver.ts # WASM PoW 求解器
├── types.ts # 类型定义
└── wasm/ # PoW 模块
SKILL.md # Agent Skill 定义
启动时自动将 SKILL.md 安装到 ~/.agent/skills/。