最早体验过claude的编码能力并兴奋地失眠像是打开了新世界的大门,不需要程序员产品经理就可以改变世界的那个世界。
用过很多免费形式,也为免费软件付过费,做出了第一个定制工具,目前还有一个用户在用且实现了月入两万,成为小某书头部创作者,所以多少感谢cursor和claude,起初也折磨了我很久,遇到bug反复改到更加崩溃失控。
引入一些文档使用技巧,版本回滚,分支备份后大为好转,那段时间cursor一直在更新。比后来windsurf的体验整体要好一些。好评。
用自然语言编程,借助 Cursor,你可以通过简单指令来编写或修改代码。
最早体验过claude的编码能力并兴奋地失眠像是打开了新世界的大门,不需要程序员产品经理就可以改变世界的那个世界。
用过很多免费形式,也为免费软件付过费,做出了第一个定制工具,目前还有一个用户在用且实现了月入两万,成为小某书头部创作者,所以多少感谢cursor和claude,起初也折磨了我很久,遇到bug反复改到更加崩溃失控。
引入一些文档使用技巧,版本回滚,分支备份后大为好转,那段时间cursor一直在更新。比后来windsurf的体验整体要好一些。好评。
一句话总结的话:老前辈级别,适合Vibe Coding入门,做些小工具小爬虫、简易前端是OK的,某种学习曲线上是n8n进阶版,但是在ClaudeCode和Codex出来以及持续改进生态之后直接降维打击了;
在25年4月的时候我还用Cursor100%全栈开发了一个APP,那时候真的是一点前后端经验都没有(我的本职是数分,经济学专业背景),甚至连前后端分离的概念都没有,所以开发的整个过程相当于每一步都在自学,理解技术栈和架构的逻辑,实打实地说能让你很快的成长,同时结果还是具有正反馈和激励性的(能让你实现能力范围之外20%-40%的事情);
但是站在现在审视过去的cursor产物,会发现在架构设计、上下文召回、工作流、代码精简性、合理性、一致性都和CC差的有点太多,整个架构写出来是松松散散的,边界情况处理的也没有CC优雅,更别提高峰期的模型降智和付费模式;
不过很适用于作为本地知识库以及处理规则相对简单的语言(比如SQL和Python,我在职的时候就用Cursor搭建了一套SQL工作流,90%的取数工作都能够帮我handle),以及调用现成的库,搭搭简单的前端,以及作为工程师的coding助手都是合格的。
Anyway,感谢Cursor把我带入vibe coding和hope coding的世界,骗进来但出不去了老师
Cursor 是国内 AI Coding 工具致敬的主要对象。
Cursor 可以免费使用一些国外模型,不是很高频的重度的场景都够用了。
Cursor 很多设计相对先进,比如国内很多 AI Coding 工具早期还需要手动选择,它很早就支持了 Auto 模式。
Cursor 很重视社区建设,会主动分享一些最佳实践,之前参加过 Cursor 杭州见面会,整体来说有收获(虽然个别分享广告味有点浓)。
大家不要只把 Cursor 当做“编码工具”,用来当做 “AI 编辑器”更适合,Cursor 杭州见面会的时候还有人分享用 Cursor 写段子!
整体来说 Cursor 算是行业标杆吧,挺好的。
说实话,在发布这么久之后,我使用cursor频率最高的场景还是写作。
代码端,我更习惯用它来修改和检查。就像使用vs code一样。
但是在写作端,真的特别好用。画面简洁,能够调用工具,本地的知识库,自动填充下一段。
我个人的使用中,相较于代码,我认为写作更好用。
cursor 我觉得是一个概念神,直到今天都有它独到的竞争力,即便现在用过了生成代码效果更好的 claude code,codeX,我还是依然很喜欢 cursor。我用 cursor 好长时间了,他可以说是我真正意义上 AI 编程的启蒙,相比于之前用的 marscode,codegeex,通义灵码,早期的 Copilot 等等仅提供孱弱的代码补全和局部代码编写能力。cursor 的出现可谓是爆杀,相信第一次使用 cursor 的代码补全的开发者都会有这种感觉,它就是很快,很准确的知道你下一步想要干啥,你在上面的代码改一个颜色,下一步他就知道你要改另外一个位置相同的颜色,你在代码里写个 if,它就知道你要把底下的代码给填充进去,这种对于琐碎事项的处理让我非常依赖,用了就感觉回不去。
我用 cursor 也写了好多好多代码了,以前做了一个小程序,在重构 UI 的过程中第一次体验 cursor,一天时间就把之前三四天才能统一好的组件样式给完成了,从那之后我基本就不怎么自己手写代码了,以前做项目我得去花在查阅官方文档、在 GitHub 或 Stack Overflow 上搜索 Bug 解法,以及在各种重复性体力劳动(比如批量给变量改名)上的大量时间,都被极大地压缩了,Cursor 是第一款真正能让我从繁琐的‘实现’中解放出来,转而专注于核心‘逻辑’和‘创造’的工具,而且他让我的野心大了很多,以前有很多灵机一动想到的点子,一想到各种琐碎的问题,再想到收益不高就干脆不搞了,现在只要有什么想法,立马打开电脑直接搓个 demo 出来,感觉没有什么技术上的事情能够难倒自己了,这种心态上的变化是最开始我自己都没有意识到的。
虽说中途有因为他们乱调价的问题把包年订阅给退了,但是销售策略是销售策略的锅,产品本身是很棒的产品,快到离谱又特别准确的代码补全,非常稳定高效的 Agent 编程规划能力,基于 RAG 实现的 codease 全局代码上下文,对话框中@ 引用文件的交互等等功能,我相信 cursor 的出现不仅仅是给后面很多 AI 编程类产品有启发,它对于任何 AI Agent 设计都是参考价值的。
即便现在随着大模型能力的提升,后续的 AI 编程工具,例如 claude code,codeX 这些命令行工具更加注重纯对话的交互,更加 vibe,但是对于我这种有一些开发经验,使用了很长时间 vscode 的人,还是没法真正的脱离 IDE 去写代码。我真的很喜欢这个产品,即便后来者有很多,但是我还是会继续用 cursor 的,我也希望自己未来做的产品,能够像 Cursor 一样给用户带来很惊艳的体验。
一代版本神,牢牢卡住了vibe coding生态位。但问题是,这个生态位本身很不牢固,claude code出来后,我就拿cursor纯当前端显示器,claude code生成代码了。
cursor是我接触过的第一款AI编程工具,最初是因为学生认证优惠才体验上,我认为目前还是新手最好上手的工具之一。
面对一整个“大黑框”,最好是能踏踏实实把每个功能按钮都点一遍,熟悉产品功能设置。
cursor的可玩性非常高,mcp、插件、终端、Git...都不在话下,它是VS Code的AI“魔改”版本,但做的很好用,生态不闭塞。
比起其他网页端一键生成的编程工具,cursor更适合“雕花”,报错红了直接甩进去文本框就好,debug更方便,整个可控性会更好一些,@文件指哪打哪。
一个代码编辑器往桌面上一摆,也似乎会显得专业一些。
虽说我现在不为它付费了(这种套壳API类的产品,用户越忠实它反而就越亏,调整计价模式后很贵,20$版本根本就不够用),但tab补全的免费次数也总让人暗爽,也有免费的模型给大伙用。
目前我主要是在它的基础上开Claude Code和Code X插件来开发,就比如「claude-code-yolo」这款插件就可以自动开启bypass模式,还是可视化的,相当不错。
还有个优势就是接入了各家模型,可以灵活使用,比如claude前端强一些,gpt5后端和整体规划很棒。
虽然是套壳,但它是会随着模型能力越来越强的,专注用户体验就好喽。
使用了半年时间,从对Cursor(以cursor为代表的AI编程工具)持怀疑态度,到现在90%的编码工作交给Cursor,有几点感受和使用上的心得:
1、能力非常强,即使是Auto模式,基本能够覆盖整个项目的前后端;
2、不能全部交给Cursor,做撒手掌柜,我现在无论是新项目还是新模块还是修Bug,比如后端我会规定好一个框架,基础的CURD会给出模板代码,不允许自由发挥,前端代码会选型好技术方案让Cursor坚决执行(比如实现一个很复杂的页面,会设计好哪些设计成组件,而不是一股脑实现),当然技术方案也可以和Cursor进行讨论,总之,我认为Cursor目前是优秀的是工具,不是合格的程序员,它们能很好地完成30~90这部分,但是如果想要做长期维护的项目,0~30的基础最好还是自己去做。
3、强烈建议非开发出身的coder,在借助Cursor完成自己的想法时,一定做好版本控制,比如git,因为真的会出现你和Cursor经过千辛万苦地努力后,在某一次撤销后,整个文件被清空了,那种奔溃感!
4、在做复杂项目时,还是需要规划好,不然初期使用很爽,当代码量和复杂程度上来后,Cutsor也很费劲,甚至会越改越差,你会想我是重构还是重构还是重构。
总体而言是好的毕竟在公司用这个免费,免费的没啥好挑剔的,但实话实话Cursor 逐渐从一个新领域的开创者慢慢变成了一个模仿者,在AI编程工具赛道上凭借快速迭代和工程化能力一度领跑,但如今的体验慢慢割裂,既没能守住早期的流畅优势,又在模型深度与稳定性上频频掉链子
老规矩先说说优点(但好像说得说得又在吐槽):
1. 工程化能力确实能打,但渐渐缺乏创新:确实舍得抄,一开始刚出的时候,在那个模型能力还不算太强的时候依靠工程化确实是领域中的王者,到后来windsurf横空出世在一些工程化上做了很多优化一度打下cursor的神谭,以及再到后来很多cli产品比如claude code,每次迭代中都能看出cursor在努力抄了?,身份逐渐从引领到跟随的转变,说是迭代但不如说是换皮。。
2. 模型支持广:模型支持多,覆盖比较全,基本上国外好用的模型都能第一时间体验上,因为我是企业版也不存在因为封禁导致不可用问题所以这方面给我的体验很不错
3. 安全意识强:开了cursor-security,比较注重安全性,算是我看过最注重安全性的公司之一,包括小到提示词注入的问题都会努力去修复,后面也上了Hacker One但是我邮箱交的就是不给我打钱?尽管我的是高威漏洞RCE,这点还是要吐槽一下,还有就是随着不断的更新在安全性的情况下越来越难用,啥都要我点点点确认,即使作为一名网络安全从业者,这种完全牺牲体验换来的廉价安全感也逐渐让我不爽
4. 入门门槛低:支持vscode和vim(没记错的话)配置一键导入,保留VS Code的熟悉界面,同时深度集成AI功能,在在刚出来的时候让我感受到了tab补全的**以及@下丰富上下文的体验,虽然在现在来看已经不算什么亮点了大家都有
再来说说缺点:
1. 自定义模型支持差:模型自定义API兼容性不行,需要官方调整才能适配,而官方每次又支持的挺慢的,这也暴露了过度工程化带来的一些不便利的限制
2. 定价混乱:定价怪怪的,我印象里调整过好几次了,在当时给人的感觉很不爽,不过我是企业版对这些定价其实也无所谓hh?,不过有一点我印象一直比较深刻,在之前推出ultra模式后虽然也是写的无限请求,但是实际上用很多次以后给我的感觉就像是加了额度限制一样,越用越不舒服,在悄悄变慢,还有一个让我不爽的点就是当时用cursor破解无限续杯的时候体验感反而比付费的好(印象里是为了吸引新用户,反正不爽就对了),另外我企业版只有500次快速使用,超过了以后就只能使用auto模式了,而auto的模型非常不好(之前有人通过gpt开源的模型权重中发现了一些glitch tokens能精准定位openai的模型),因为这些AI IDE最后的分水岭其实与模型能力关系比较大,对于我这个企业用户来说不是特别爽用的
3. 进阶功能深,学习成本不降反升:尽管上面说了入门曲线体验好,但在进阶体验上给我的感觉不是很好,很多自带的高级功能是我在不断试错中才逐渐掌握的,或许想以前JetBrain一样,每次启动弹出一个小技巧或许更好
4. 广但不深:覆盖面全但不深,我以前在开发的时候很喜欢JetBrains的产品,特别是他家的静态分析以及对各个语言单独的深入支持,更方便做测试以及调试,尽管没有AI功能让我渐渐疏远了他,但是在很多时候我还是更喜欢用JetBrains去分析产品
5. AI输出不稳定,下破趋势明显:特别是经历了很多次迭代以后反而给我的感觉是不如从前,相比较以前现在会经常破坏掉本来好的代码,而且也会在不经意间引入一些低级错误,另外上下文管理也不是特别优秀,随着代码不断增多,越来越难以保证准确性了,完全没有让我感受到codebase带来的与众不同
进阶学习成本高
帮我写了挺多demo的,如果只需要小型项目0-1且后续不再维护,挺好用的
另一方面,当我充钱使用claude模型,给了他一个8w+行的业务项目以及一份代码架构约束后让他重构,效果不好评价,最后我还是回归手动重构了。当然我很清楚现阶段也没有别的产品能做好这点,所以还是留个good,希望后面能来一波进化
产品是好产品,但我为什么打差评,因为不透明、不稳定:计费方式不稳定、效果不稳定。
在评价之前,我要先讲讲我用cursor的故事,当然,纯手打,没有AI润色。
我从2024年12月开始用cursor,那时候的sota模型是claude3.5和gpt-4,Gemini还在吊车尾,n8n还对AI兼容得不够好,我还在用dify, 最好用的AI coding工具是github copilot, 我还为此付了六百多块钱。
24年12月的时候忘了因为什么原因用上了cursor,好像是AI coding火起来了,大家都在尝试用AI写项目。当时我有一个需求,是自己的github 点了star的项目太多了缺少管理,有个叫astros的php项目用了一段时间但是停止维护了。有时候完全可以在自己的git stars里去搜索,但是还要去查关键词找项目,看了半天发现是自己点过star的。于是要自己写个github star management,但是不会写前端,也不会js。
在cursor的帮助下,大概2个工作日晚上,用完了免费额度搓了一个原型,前后端都用cursor写的,代码我能读懂逻辑但是改不了一点,一次tab功能都没用过,我很满意,然后付费开了1个月。(图1)
在接下来的一个月(实际是3天) 里饱受vibe coding的折磨,我真傻,真的,我单知道AI 写代码强但是改代码不行,没想到竟然如此多的“you are absolutely right”然后写一坨屎山。
于是我在强忍着恶心修完所有bug之后,结束了vibe coding。(图2)
虽然后半段体验很糟糕,但是不得不说这一套纯AI构建的系统工作得还蛮稳定的,我用了半年多,直到想要前端重构。
这时候是今年八月份,deepseek早已沉寂,gemini 2.5 pro和 sonnet 4 左手长上下文、右手代码生成,打得是风声水起。gpt此时最强模型还是O3和4.5,差点意思。
AI coding江湖也是硝烟四起,主打前端的V0,声名鹊起的claude code,跟风的gemini-code/qwen-code ,号称透明的windsuf,甚至字节的trae,还有各家AI coding vscode插件比如kiro code,以及jetbrains也下场做AI coding了。 我记得好像腾讯的codebuddy也是这段时间的,我还写了个评价。
得益于lenny‘s newsletter的年费订阅,我同时有v0和cursor的pro,还要感谢社区的公益站,让我免费用上了claude code,gemini 大善人更不用说,没在gemini上花过钱,以及注册就送200次使用的kiro code。
这个时候用AI产品用得多的我肯定是涨经验了,用社区评价好的v0来优先做前端设计,然后再优化。
我又犯了一次错误,我单知道AI模型不可同日而语,AI产品也是日新月异,但是我不知道它还是不擅长修bug,v0.dev 5刀做出满意的原型,20刀都没修完1个bug。
于是拖着没修完的bug同时去找cursor和claude code,虽然已经是claude4.0时代了,但是项目也变大了,cursor调了半天才勉强通过引入另一个bug来修这个bug,但是Claude code很快啊,一个左正蹬,一个右鞭腿,它连npm run dev都不执行,就修好了,当时我是惊为天人。
但是由于命令行不好管理文件,我就在cursor的命令行里运行cc,看着cursor来建设,cc来修bug,牛骑着马,也是两三个工作日晚上就完成了。(图3)
从此我爱上了claude code,虽然现在还没折腾明白mcp的配置。
故事讲完了,到评价部分了。
cursor的优点:
1. 先发优势,在AI coding还不火的时候把这方面做到了当时的极致,可以说是vibe coding的奠基者了
2. 模型更新快,新模型上了就猛猛跟进,我记得gpt-4.5刚上的时候还免费提供一个礼拜使用
3. 偶尔大方,比如试用、edu之类的,社区的人薅到了羊毛给大伙送温暖
4. 功能全面,毕竟基于vscode改的,该有的都有。
缺点:
1. 模型的前置提示词过于不透明,更新也不说,有时候降智都不知道是厂商降智(参考claude降智事件),还是模型掺水,还是改了prompt(openai/gemini也有过此类情况),当然这是通病,但是cursor套的层级有点多了就不好说。那个时候4.0/3.7/3.5差别没有特别大,所以掺水也说不准。
2. 功能单一,初始设计就是为了写代码,后来大家要求多了,比如写文档、做研究啥的,但是体验下来让cursor去做非代码类的工作就很糟糕,相比之下claude code却是一个通用助手。(补充一下,现在好很多了,图4 的效果我看起来感觉还行)
3. 计费不透明,我到现在都没有一个月清楚我的计费是怎么记的,只有最开始的按次数计算清楚。现在就是用着用着等它什么时候跟我说费用不够了,根本算不了大概还有多少。
4. 形态变化太大,cursor cli 和 cursor app 差了太多,感觉 prompt完全不一样;web版的cursor agent也是一个纯代码助手,代码以外的活都干不了,完全不如最近用的droid。当然这部分体验比较主观,不能提供一个好的例子。感觉cursor是有点没想明白,市场什么热就做什么,也可能主要还是为了蹭热度拿投资吧
总之,感觉cursor从队伍头部变成一个中游玩家了。
AI Coding的里程碑产品这个没得说,作为第一款接触的AI IDE,界面简单功能完善bug修复成功率高,用Cursor 开发了好几款App和小程序以及一些自己常用的小工具,都做得很完美且成功上线。也帮我解决解决了很多工作中遇到的难题。致敬!
我第一次的vibe体验就是Cursor。当时真的很惊艳!第一次的使用感受就是不再需要自己当编译器和AI之间的中转站了,可以更加沉浸的修改代码,像是和一个不会骂人态度很好又很能干的队友一起打磨一个产品。当然也有队友发癫“发现问题→解决问题→删除代码(从源头解决问题)”的崩溃瞬间。
同时,在一些小功能的实现上真的体验感很好!在2026跨年的时候,三分钟生成一个倒计时代码,完美补救和朋友拍视频没有倒计时的遗憾!哈哈哈哈哈!好感飙升!感觉AI真的在潜移默化地改变着我们生活和工作的习惯。
刚参加完杭州黑客松回来,现场就是用的 Cursor Pro 版本开发的。
先说一下体验,整个项目最后是做完了的,包括:
1. 产品原型的迭代
2. 后续推送到魔搭创空间的部署
这些过程都是用的 Auto 模式。这次的体验非常丝滑,我真正 get 到了为什么说 AI 编程大大降低了门槛,在现场是真正感受到了。比如说我们部署的时候,可以直接把魔搭空间的部署文档发送给它,然后再输入对应的提示词。它就会根据文档要求,将代码推送到对应的空间并进行部署。最后,你只需要去创空间的界面进行上线操作就可以了。
3.关于 Cursor 的使用心得,我有以下几点总结:
① 配置与插件调用:
Cursor 需要配置一些 Rules,同时建议调用一些 MCP(Model Context Protocol)。这次我的输出质量之所以比较稳定,是因为我当时带了一个用Gemini3 pro 做出来的纯前端文件。我原本想研究如何将 API 调用放在后端,于是去找了 Zion(具体经历我会在 Zion 的评论区详细说明,大家感兴趣可以移步那边)。
②. 版本管理的重要性:
那天下午四点左右,我在使用 Cursor 时遇到了问题。在调用一个 MCP 时发现无法运行,起初我以为是电脑配置或安装问题,折腾了很久才发现是新版本对 MCP 的支持出了故障。
我在论坛反馈后,官方工作人员给出了一些解决方案。这件事让我意识到,做好 Cursor 的版本管理至关重要。
3. 解决方案:
随后我找到一个提供完整历史版本的网站,下载了在那次更新之前、尚无问题的最新版本,并配合 Pro 订阅进行深度体验。
说说我用Cursor的经历吧,过程挺曲折,但成果挺香的。
2025年2月25日就装了Cursor,可我一个技术小白,完全摸不着头绪——界面看不懂,功能不会用,好几次想卸载,可总觉得说不定以后能用得上,就没舍得,就这么搁在电脑里“吃灰”了。
到了7月份,我参加了AI编程行动营,本来想趁这个机会学学Cursor,结果赶上它在国内被禁用了,只能用其他工具代替,这事儿就又搁下了,心里总觉得有点遗憾。
直到今年10月,在同行的鼓励下,我又试着打开了Cursor——没想到居然能用了!而且用它召唤Claude code特别顺手,比之前用的工具好用多了。我立马用它做了NanoBanana的网页,还有几个其他小网页,居然都做成了,成就感爆棚!
不过也遇到点小问题:因为我调用的是质谱API,有时候会遇到修改内容不到位的情况,得反复调个好几次。但后来问了问身边用Cursor的伙伴,他们说改功能本来就需要反复调整,有的甚至要花一两个小时,我这才放宽心,觉得这是正常现象。
作为AI编程小白,只用自然语言编程确实比懂代码的技术人员少了点优势——他们能直接改代码,我们只能靠自然语言指令,有时候还说不清楚要什么。但Cursor整体表现真的不错,对命令的识别很准,哪怕我表述得有点含糊,它也能get到我的意思,做出来的东西也很符合预期。
现在回头看,虽然一开始差点卸载它,中间又遇到禁用的波折,但幸好没放弃。现在Cursor已经是我AI编程的得力助手了,帮我做了不少事儿,也让我对学编程更有信心了~
我从去年开始使用 cursor,一直到今年 5 月份左右,我都在高强度的使用,但是我从来没有用过 auto 模式,我会认真的研究每一个新发布的模型的 SWE-bench 分数,然后在 cursor 上线的时候第一时间开始使用
后来 cursor 引入了不太透明的计费机制,MAX mode,老实说这让我有点不舒服,并且在高峰时期,热门模型的回复非常缓慢。当时正值 claude code 和 codex 开始逐渐发力,正好我也开始订阅 Anthropic 和 openai 的 pro 计划,因此我转向了 claude code 和 codex
我个人挺喜欢 terminal coding agent,因为他们事实上是承诺了一种 “不需要打开 IDE/直接编辑代码的编程体验”,我可以聚焦于高层次的意图和设计,而不用关心细枝末节的东西,但是随着编程的深入,我发现“不求甚解” 的编程在一开始可能确实很爽快,但是编码的过程会引入大量潜在的问题,从而使得后续的拓展和维护非常困难
正好这周我用光了 codex 和 claude code 的限额,而我始终保留着 cursor 的订阅,因此我久违的打开了 cursor,并在 tab completion 的帮助下开始编码,并且时不时的用 auto mode 解决一些问题
我开始觉得事情有点不对劲,auto mode 的表现比我预想的好太多了,它在这些情况下表现良好:
A:我只是想要关于某端代码的 quick answer。比如:“这个 forward compatible 的配置是否可以安全的移除”,auto mode 能快速精准的给出答案
B:稍微复杂一点的问题。比如我最近正在开发一个比较底层的音频处理流水线,我需要在流水线级别实现一个控制信号,这涉及对非常多的代码逻辑的阅读,以确保引入新的信号不会带来意料之外的副作用,auto mode 表现的很好,它看起来在调用 reasoning model,并准确的沿着 pipe 阅读了相关的代码逻辑,并且提供了非常完整的解决方案和风险预警
C:编码工作。当我定位了问题,有了一个解决方案,并且规划好了 commits,auto mode 能够快速精准的按照我的需求实现代码,并且没有做多余的事情,这一点非常重要,因为我经常在 claude code 中发出 “i didn’t ask you to do that” 这样的感叹,即使我已经很明确的提供了 prompt
我承认一开始我觉得 auto mode 只是一个降低成本的把戏,但是后来我在使用 claude code 和 codex 的时候开始意识到,agentic coding 的用户 token 用量具有极大的方差和不可预测性,因此即使是 claude code MAX plan 这样 200$ 的订阅方案也不得不引入周限流,成本控制对于这类公司来说是一个非常大的挑战
现在,基于我自己的亲身体验,我想为 cursor 团队点赞,auto mode 是一个了不起的产品设计,我对此曾经有误解,但是我越来越意识到在 cost-efficiency-performance 这个不可能的三角中取得平衡是很困难的事情,但是 cursor 团队一直在不断的优化 auto mode 的体验,而这样的体验是 SWE-bench 无法衡量的
更重要的是,我认为这是一个很好的 AI 产品公司商业化模式的探索,我们所看到的情况是 Codex 和 Claude Code 由于 token usage 压力而不同程度的引入了限流措施,最近 reddit 上 claude code 的 sub 也在大量的反馈自己订阅的 plan 所对应的 rate limit 完全不及预期。而 cursor auto model 可能是一条可行的路径,它可以根据任务难度选择合适的模型,跟 GPT-5-Chat 的方向是一致的,长期来看也是更加可持续的
模型发展到现在,各家后训练逐渐成熟,产品的取向也日渐清晰,比如:
- GPT:最强的思考,可观的上下文
- Claude:放弃最强智能(怀念老版本的 Opus),All in Agent(terminal、tool calling、coding)
- GLM:开始尝试在 agent 和 terminal coding 上挑战 claude
- Gemini:超长上下文,Flash 模型速度快成本低
- Qwen:每一项都不差
我自己日常工作里也会搭配这些模型,在不降低效果的情况下获得较低的成本,至少比全部都用 GPT-5 要低很多
我相信没有模型能够在所有的任务上都做到最好,那么这是否意味着 model routing 不但可以缓解成本压力,甚至有可能让路由的结果超过单一的最强模型?结合最近 cursor blog 曝出的 tab completion 通过 online RL 实现了 28% 的采纳率提升,也许 cursor 同样在 auto model 上使用了类似的基于用户反馈的训练机制?如果 cursor 团队真的探索出了一条通过数据反馈提升 model routing 效能的方式,那么我觉得这是非常了不起的
说一个题外话,claude code 在前端时间承认偷偷更新了模型并且导致了不同程度的 “降智” 现象,我原先认为 auto mode 是一种不透明,但现在回过头来看,至少你可以在 cursor 里明确的选择 “我要最好的模型” 还是 “我希望获得一个平衡的体验”,而不是对底层发生的事情一无所知
TL,DR: 目前 Tier1 级别的编程工具,会主动向量化代码库以便于 AI 匹配,但在价格和使用便捷性上仍有一定不可抗的问题。
Cursor 可以说是老牌强势的编程软件了。模型稳定强力,但对于免费用户不是十分的友好。存在 Rate Limit 限速和高级模型使用量限制。优点在于支持 BYOK 选项,可自带 API Key 使用(但不支持国内阿里云和月之暗面的入口,需要特殊调整)。一个比较特殊的点在于,如果你选择的编程语言有 Linter 存在且恰好 Cursor 支持,那么你的 Agent 在编写完成代码后还会主动对照 Linter 的语法反馈,自行修复语法错误和潜在的代码问题。
Cursor 的编程能力和结果质量和使用者/路径规划者自身的能力/思维有着较强的关联性。在编程语言的喜好上,偏向于 Python,JS/TS,React 等国外流行的选型,在国内环境的部分任务下会出现“水土不服”的情况。
就目前(截至2025-07)的使用体验和模型能力来说,Cursor 可以小幅度领先于 Windsurf 和 Trae ,和目前主流的 CLI Agent (终端命令行版本的 Agent)持平。
1199
更新于 2026-05-06