标签:性能突破
Claude最强领域被GPT反超!GPT 5.5最难编程基准破0
在编程能力评估领域,大模型技术近日取得显著进展。程序重建基准测试长期被视为极高难度的技术考验,要求智能体在仅获取编译文件与说明文档、严禁反编译且完...
ChatGPT那一套要过时了?翁荔实测创业首个模型,回合制AI被“原生实时交互”秒了
专项数据测试验证了该技术路线的显著代差。基准评估显示,该模型将首轮响应耗时压缩至零点四秒,同时在核心交互质量评分上逼近主要竞对的两倍水平,成功跨越...
比人类专家快2倍,斯坦福联合英伟达发布TTT-Discover:用「测试时强化学习」攻克科学难题
在技术快速发展的背景下,如何利用人工智能发现科学问题的新最优解成为业界关注的焦点。传统的「测试时搜索」方法依赖冻结的大语言模型(LLM)通过多次尝试改...
击败GPT、Gemini,复旦×创智孵化创业团队「模思智能」,语音模型上新了
模思智能发布的多说话人自动语音识别模型MOSS-Transcribe-Diarize在语音识别与分析领域取得突破性进展。该模型由复旦邱锡鹏团队研发,能够同时完成语音转文字...
“在数学上,中国模型没输过”!DeepSeek 深夜屠榜,Math V2 以碾压姿态终结“最强数学模型”之争
11月27日晚,DeepSeek在未提前预告的情况下开源了数学推理模型DeepSeek-Math-V2,其685B参数规模成为业内首个达到国际奥林匹克数学竞赛(IMO)金牌水平且全面...
2M大小模型定义表格理解极限,清华大学崔鹏团队开源LimiX-2M
在AI领域,大语言模型(LLM)虽在非结构化数据处理上表现卓越,却在结构化表格数据建模中长期难以超越传统梯度提升方法。这一现象引发了关于深度学习在结构化...
一颗芯片的新战争
每年9月通常是手机新品发布的高峰期,但今年科技界的焦点已转向AI推理芯片领域的激烈竞争。随着AI应用从训练转向商业化落地,推理市场正迎来爆发式增长。麦肯...
CUDA内核之神、全球最强GPU程序员?OpenAI的这位幕后大神是谁
在AI领域,聚光灯往往聚焦于明星人物,但幕后工程师的关键贡献同样不可忽视。OpenAI资深工程师Scott Gray因其卓越的GPU编程能力成为近期焦点。他编写的CUDA K...
最新W4A4KV4全量化框架,单卡A100大模型推理速度飙升
王颖研究员团队联合华北电力大学和上海科技大学,在ASPLOS 2025会议上发布了COMET框架,该框架通过系统-算法协同优化,实现了权重、激活和KV缓存全4比特推理...
雷军为什么不学「友商」卷智驾?
2月27日晚,小米SU7 Ultra以52.99万元的起售价正式发布,比四个月前预售价降低28.5万元的定价策略引发市场震动。这款售价超过50万元的产品,不仅刷新了小米品...



