标签:代码生成
Claude Code之父删了IDE!干掉提示词,只写循环
AI编程领域正经历一场深刻的范式迁移,开发者从亲自编写代码和提示词,转向设计自动化循环系统来指挥编程智能体。这种被称为“循环工程”的新模式,标志着传统...
Code Arena全球可用模型第一!智谱GLM-5.2上线并开源
智谱近期上线并开源了GLM-5.2大语言模型,在多项全球权威评估中表现卓越。在前端开发评估系统Code Arena及全球最大众包设计基准平台上,该模型均取得全球可用...
GLM 5.2:给国产模型追赶Anthropic 又提了一口气|附实测
美国近期以国家安全为由对部分前沿人工智能模型实施严格的访问限制。在此背景下,中国人工智能企业智谱宣布全面开源其最新一代大模型GLM-5.2,采用无地域限制...
硅星人 Eval Eps.2|Fable 5评测:强,贵,甚至能发现自己正在被检测
Anthropic近期推出了Claude Fable 5模型,其底层与Mythos 5相同,并在安全护栏上进行了全面优化。该模型在多项权威基准测试中成绩优异,被业界视为一次阶跃式...
Anthropic联创亲口承认:AI正自我迭代!
Anthropic联合创始人Jack Clark近期披露了一项关键数据,指出目前Anthropic合入的代码中已有80%由Claude自主编写。他预测在两年内,这一比例可能达到100%,标...
xAI解散,但Grok还在上新,马斯克官宣新模型
xAI团队近期公布了Grok大模型的最新进展,参数量达1.5T的Grok基础模型V9-Medium已完成训练并进入微调阶段,预计两到三周内公开发布。新模型不仅将参数规模扩...
排名第九、国内第二,DeepSeek V4 凭什么让人又爱又恨?
针对DeepSeek V4发布后引发的市场落差感,实测并未沿用西方主导的通用榜单标准,而是转向贴合中国用户实际需求的定制化评估体系。通过构建古诗词理解、法律条...
0%完成率!Claude、GPT、Gemini 全灭,SWE-Bench作者新作把AI圈干沉默了
当前顶级大模型在真实软件系统重建任务中面临严峻考验。最新基准测试首次将评估标准从局部代码补全推向完整的工程重建,要求模型仅凭借功能文档从零构建真实...
小米双模型正式开源!MiMo-V2.5-Pro无中断肝出“macOS”:54个应用全开、浏览器真能冲浪
实测数据验证了模型在全流程自动化编程方面的执行效率,系统可在连续四小时内完全脱离人工干预,独立完成包含完整状态机逻辑与五十余个功能组件的桌面级系统...
xAI落后太多,马斯克“开大”重金求购Cursor,100亿美金“分手费”都敢签!
SpaceX 宣布与代码生成初创公司 Cursor 达成合作协议,计划在今年晚些时候以 600 亿美元收购该公司,或为合作关系支付 100 亿美元。此次合作旨在结合 Cursor ...


