产品
Cursor发布首个大型编程模型!代码生成250个Toke
杰伊 发表者:奥飞斯量子比特 |公众号Qbitaicursor首个编码模型已发布!最新进展是,Cursor 2.0已正式发布,并首次搭载“内部”大型号。没错,这不是GPT,也不是克劳德。现在 Model 栏目里多了一个新名字——Composer 非常强大:根据官方的说法,Composer 可以在短短 30 秒内完成复杂的任务,比同行快 400%。在模型升级的基础上,Cursor 2.0带来了很多新东西——原生浏览器工具:模型可以测试代码、调试、自我回避,直到结果完全正确。语音生成代码:无需敲击键盘,只需张开嘴,将你的想法直接转化为代码。新的界面逻辑:从“以文件为中心”切换为“以代理为中心”,多个代理可以同时运行,互不干扰。它允许许多代理同时尝试同一问题选择最好的可以显着改善最终结果。有太多太多值得观看的东西。 400% 的效率一跃而起,其他一切都只是小菜一碟。最爆炸的还是——光标其实有自己的基础模型。要知道,前面的光标虽然流行,但本质上只是GPT或者Claude的一个外壳。再厉害,也不是光标的功劳。但这一次不同,官方作曲家已经正式登场,Cursor终于可以理顺了。不出所料,这次官网的语气有点强硬。 (DOGE) Curs saidor,这个模型是专门为低延迟编码而构建的,可以在 30 秒内完成大多数交互任务。即使面对庞大而复杂的代码库,也能保持高水平的推理和理解能力。除了炫酷的演示之外,当然你还需要用基准来秀一下你的肌肉。康波Ser性能全部由内部测试套件“cursor bench”来衡量——一个基于真实开发人员使用场景的评估系统。该基准测试不仅检查代码是否正确,还检查模型是否能够遵守抽象级别、样式规范和工程实践。结果表明,Composer 可以以每秒 250 个令牌的速度生成代码。它几乎比当前最快的推理模型(GPT-5、Claude Sonnet 4.5)快两倍,比其他模型快四倍。速度更快了,但大脑依然灵活。作曲家推理能力和任务泛化能力显着提升,水平堪比中级新锐模型。教育部基于强化学习的自主开发模型是如何取得如此惊人的表现的呢?光标研究科学家 Sasha Rush 揭示了答案——而主要原因在于强化学习。我们使用强化学习训练了一个大型 MOE 模型o 它更接近真实的编程任务并且速度非常快。同时,为了配合强化研究,Cursor将自己的努力做到了极致。与其他机器学习技术不同,强化学习几乎不能完全从完整的系统中推断出来。因此,我们聘请了一位作曲家并设计了 Cursor,以确保它能够在实际规模下良好运行。强化学习最大的特点就是需要在真实的环境中“工作”,才能学到真正的技能。如果composer只修改虚拟数据集中的代码,它不知道代码是否有bug,也不知道测试能否通过。因此,Cursor只能让模型直接去“进入战场”。在完整的光标环境中运行、调用工具、执行命令,并通过一次又一次的真实交互获得最有效的反馈信号。具体来说,作曲家的训练不是fedof静态数据集,而是基于真实的软件工程师完成的ing 任务。在训练过程中,模型直接在完整的代码库上工作,使用一整套生产级工具:文件编辑、语义搜索、终端命令……面对复杂的工程问题,它必须编写、测试和自我纠正。每轮练习对应一个特定的任务,例如编写更改、起草计划或解释特定的代码逻辑。事实证明,扩音的研究确实让作曲家的演奏上了一个台阶。了解如何明智地选择工具,执行灵活的并行处理,并停止给用户无用的卡片。随着训练的进行,该模型还表现出惊人的行为——它可以自动运行单元测试、修复代码格式错误,甚至独立完成代码搜索和调试过程。 Cursor 2.0 为多智能体协作提供的基础设施正式基于底层 Composer 功能。值得注意的是,这次 Cursor 带来的不仅仅是更快的模型,而是一个真正致力于战斗的人工智能系统。 Cursor 不再只是试图与头基模型竞争,而是更加聪明,利用了其产品在应用端的优势——让 Composer 直接运行在与用户相同的环境中,真正适应日常开发流程。光标,你真的研究过自己吗?话虽如此,compositor的效果确实很惊人,但是光标似乎刻意回避了一个研究重新强化问题也可以,但是你必须把模型的基础搞清楚。作曲家缺乏透明度简直令人愤慨。他们提到使用强化学习,但没有解释模型的其他训练过程——是自己训练的,还是从现成的模型修改而来的?我会对这些说法持保留态度,直到它们揭示更多细节,或者有人可以独立复制结果。光标研究员 Sasha Rush 亲自这几天在 Hacker News 上回答问题,但他并没有直接回应“核心模型来源”的问题。当直接问到“Composer 是不是开源模型好”时,Rush 的回答是:我们主要关注的是加强训练后学习阶段,我们认为这是制作强交互代理模型的最佳方式。但可以肯定的是,Cursor 过去有自己的内部模型。据悉,Cheetah 是 compositor 的早期原型,团队用它来测试系统集成的生成速度和效果。但是,基于 compositor 的正式版本猎豹,还是从开源模型的框架改过来……我们还需要让子弹飞一会儿~ [1] https://news.ycombinator.com/item?id=45748725 [2] https://simonwillison.net/2025/oct/29/cursor-composer/ [3] https://venturebeat.com/ai/vibe-coding -Platform-Cursor-Releases-first-in-house-llm-composer-promising [4] https://cursor.com/cn/blog/2-0 [5] ht tps://x.com/srush_nlp/status/1983572683355725869 [6] https://x.com/cursor_ai/status/1983567619946147967
特别声明:以上内容(如有则包括照片或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易HAO用户上传发布,网易HAO为社交媒体平台,仅提供信息存储服务。 上一篇:“水果姐”自曝与加拿大前总理关系 下一篇:没有了
