← 返回访谈列表

Cursor Team 深度访谈

Cursor Team: Future of Programming with AI | Lex Fridman Podcast #447

8
话题段落
3363
字幕段落
148m
对话时长
-
核心金句

📋 访谈摘要

加载中...

📖 话题详览

点击任意话题卡片查看该时段的完整对话内容。

开场:Cursor与AI编程的宏观主题

Lex在开场介绍Cursor团队的四位创始成员,并说明Cursor是基于VS Code构建、加入强大AI辅助编程能力的代码编辑器。他强调,这场对话不只是讨论一个编辑器产品,而是借Cursor切入更大的议题:AI在编程中的角色、未来软件开发方式,以及人类与AI如何协作设计和工程化复杂系统。开场奠定了技术深聊的基调,也将Cursor定位为观察AI改变程序员工作流的重要案例。

CursorAI编程人机协作软件工程

代码编辑器的本质与乐趣

嘉宾首先回答“代码编辑器的意义”这一基础问题:它是构建软件的主要场所,传统上是程序员编辑形式化编程语言的工具。相比普通文字处理器,代码编辑器能利用代码结构提供语法高亮、定义跳转、错误检查等能力。团队还强调,编辑器应该“好玩”,而好玩的重要来源是速度。快速迭代让编程区别于许多受资源或组织限制的领域,程序员可以只凭自己和电脑迅速构建有价值的东西。

代码编辑器开发体验速度迭代

从Vim到VS Code与Copilot体验

团队回顾了自己的编辑器迁移经历:他们最初都是纯Vim用户,后来因为GitHub Copilot在2021年测试版上线,而进入VS Code体验AI补全。Copilot能根据用户正在写的内容建议一到数行代码,带来类似朋友替你补全句子的感觉;当建议准确时,会产生“它懂我”的亲密体验。即使Copilot出错,用户也只需继续输入几个字符重新引导,因此错误成本较低。嘉宾认为Copilot是第一个真正成功的语言模型消费级产品。

VimVS CodeCopilot自动补全

Scaling Laws、GPT-4与Cursor起源

Cursor的起源与团队对Scaling Laws的判断紧密相关。约在2020年OpenAI相关论文出现后,他们认为模型能力会随着算力和数据增加而可预测地提升。Copilot让这种理论进展第一次变得具体,而2022年底早期接触GPT-4则让他们感到能力跃迁巨大。此前团队尝试过面向金融专业人士的Jupyter工具、用模型做静态分析等点状项目,但GPT-4让他们相信,未来不是单点工具,而是整个编程流程都会经过模型,因此需要新的编程环境。

Scaling LawsGPT-4Cursor起源编程环境

模型能力进展与数学领域的信号

团队谈到早期对AI能力进展的判断分歧,其中Aman曾预测模型可能在2024年前后接近国际数学奥林匹克金牌水平,当时其他人觉得过于乐观,但后来的DeepMind结果显示这一判断接近正确。嘉宾进一步解释,数学尤其是形式化定理证明,是模型进步的理想领域,因为可以获得清晰的正确性验证信号,从而适合强化学习等方法。他们也谨慎指出,系统在数学上达到超人水平,并不必然意味着已经实现通用人工智能。

数学推理IMO强化学习AGI

为什么Fork VS Code而不是做插件

Lex将讨论带回Cursor本身:它是VS Code的分支,而不是普通扩展。团队解释,选择做完整编辑器对他们来说几乎是不言自明的,因为他们相信模型能力会持续提升,并彻底改变软件构建方式。如果只是现有编辑器中的插件,就会受到API和交互边界限制,无法充分控制开发体验。他们想要构建最有用的东西,而不是被已有环境锁住,因此选择fork VS Code来重新设计AI如何融入编辑流程。

VS Code插件限制产品架构编辑器分支

创业公司速度与端到端AI体验

在谈到如何与VS Code和Copilot竞争时,团队强调AI编程工具的关键不是静态功能,而是不断把新模型能力转化为程序员能力。每一次模型跃迁都会解锁新交互和新产品可能,因此领先几个月就可能让产品显著更有用。他们认为Cursor一年后的版本应让今天的Cursor显得过时。团队还指出,Cursor的优势在于同时做用户体验、提示构建、上下文检索和模型训练,做UI的人与训练模型的人距离很近,甚至常常是同一个人,并且团队用Cursor写Cursor。

创业速度产品迭代模型能力端到端体验

Cursor Tab:预测下一步编辑

最后一段进入Cursor核心功能Tab。团队将Cursor当前能力概括为两类:一是像快速同事一样在用户身后观察,预测下一步要做什么;二是让用户通过指令跳到AI前面,把意图转化为代码。Tab不只是补全光标后的字符,而是预测下一次完整修改、下一个diff甚至下一个应跳转的位置。团队希望消除编辑器里的低熵操作:当意图已被上下文确定时,模型应直接替用户完成跳转和修改。技术上,这要求极低延迟、小模型、长上下文预填充、稀疏MoE模型以及推理优化。

Cursor Tab低熵操作代码编辑模型推理