大家好,我是苍何。
Cursor 中已经支持使用最新版的 ,也就是 DeepSeek-R1-0528。
说个比较抽象的事,当在 Cursor 中选择 R1 最新模型,会有这样的提醒。
大概意思是说,DeepSeek-R1-0528 模型不大支持 Agent 模式,建议使用 Manual 模式。
这里经常使用 Cursor 的小伙伴应该 Cursor 中支持的三种模式,这里我简单解释一下。
Agent 模式:全自动“保姆”,可自行遍历代码库、改多文件并跑终端命令,适合一条指令搞定复杂任务。
Ask 模式:纯提问的只读聊天,帮你搜索和解释代码,却绝不会替你动任何文件。
Manual 模式:精准受控编辑,只按你 @ 出的文件和指令生成补丁,不主动探索代码或执行命令。没有 tool。
可以看到 Cursor 中如果使用 DeepSeek-R1-0528 模型的话,官方是推荐 Manual 模式的。
这里你会不会比较好奇,为啥同样都是大模型,Claude 就能支持 Agent 模式,而 却不行呢?
最关键的是, DeepSeek-R1-0528 明明就有 Function Calling 啊,为啥就是不支持呢?
我让 O3 给了一份解释:
原因是 Cursor Agent 需要模型在 流式输出 中随时发出工具调用指令,IDE 执行后把结果回填,再让模型“续写”。DeepSeek 目前是一口气返回整条消息,无法“挂起”等待 IDE 反馈,因此 Agent 链路会在第一次 处直接终止。
另外 DeepSeek 官方的声明里明确“工具调用不发生在 thinking 中”。而 Cursor Agent 的核心就是在 plan / think 步骤里多次调工具,DeepSeek 无法配合。
目前 Cursor 官方并未完全适配 DeepSeek,所以要想在 Cursor 中使用 DeepSeek 的 Agent 模式还得等一等。
在介绍 DeepSeek R1 新模型时,我们来看下时间线。
DeepSeek 在 28 号晚又悄悄更新了一波 DeepSeek-R1 模型。
本以为就是个小更新,结果在整个圈子里又热闹了。据官方介绍,DeepSeek-R1-0528 主要提升如下:
看了下各大主流模型的评测数据对比,不难看出,DeepSeek-R1-0528 在数学类(AIME)测试中夺冠,展现极强的逻辑推理与计算能力。
于是我也第一时间(呸,第二时间)做了下测试,先说我测下来的结论:
DeepSeek-R1-0528 的前端代码能力及推理能力已经超过 Claude Sonnet 4。
并且找了一张大佬发掘的为啥 R1 有增强的原因。
下面基于我的经验,一共做了 5 个 case 的对比,也花费了不少时间,如果喜欢,不妨给老苍何个赞。
这里同样采用之前文章中的提示词,将任意文件,生成一个精美的可视化网站。
提示词如下:
这是 DeepSeek-R1-0528 生成的效果。
这是老版 DeepSeek R1 生成的效果:
新版在整个 AI 的审美上确实有很大进步,而且文章中的 GIF 图片也能给很好的展示出来。
这个是 Claude4 生成的效果:
整体对比下来,DeepSeek-R 1-0528 和 Claude 前端页面审美上区别不是很大,但 DeepSeek 能很好的理解文件中的图片并展示在页面上。
这一点是 DeepSeek 更强一些,他甚至将 GIF 图都给展示了。
在之前的中,我利用 12306 MCP 查了列车途径站点的信息,然后通过 Claude4 生成沿途站点的旅行地图。
这个效果,是我在 Cursor 中调试了好几轮,特别是在图片展示上,目前依旧不完美。
我本想通过 Cursor 用上新的 DeepSeek R1 做一波对比测试,发现对 agent 的支持并不大友好。
于是只能先用 Cursor 接入 12306 MCP 查询列车信息:
为了对比下旧版本,我先把这个提示词给了他。
旧版本 R1 出的效果:
同样我把这个提示词直接复制到 DeepSeek 网页上,也就是新版 DeepSeek R1 的效果如下:
这个对比还是足够直观的,我只用了一次就出来这个效果,如果多次调整,整个效果会更好些。
可以看到 R1 的升级,能力确实变强了。
一个很经典的测试大模型物理世界理解能力的例子,就是弹跳小球实验。
当我输入以下提示词:
这是 DeepSeek R1 一次生成的样子:
这个是 Claude Sonnet 4 生成的代码。
小球,直接就飞出五边形之外了