性能突破 | 学习AIGC

Claude最强领域被GPT反超！GPT 5.5最难编程基准破0

在编程能力评估领域，大模型技术近日取得显著进展。程序重建基准测试长期被视为极高难度的技术考验，要求智能体在仅获取编译文件与说明文档、严禁反编译且完...

AIGC动态

2小时前

ChatGPT那一套要过时了？翁荔实测创业首个模型，回合制AI被“原生实时交互”秒了

专项数据测试验证了该技术路线的显著代差。基准评估显示，该模型将首轮响应耗时压缩至零点四秒，同时在核心交互质量评分上逼近主要竞对的两倍水平，成功跨越...

AIGC动态

1周前

比人类专家快2倍，斯坦福联合英伟达发布TTT-Discover：用「测试时强化学习」攻克科学难题

在技术快速发展的背景下，如何利用人工智能发现科学问题的新最优解成为业界关注的焦点。传统的「测试时搜索」方法依赖冻结的大语言模型（LLM）通过多次尝试改...

AIGC动态

4个月前

击败GPT、Gemini，复旦×创智孵化创业团队「模思智能」，语音模型上新了

模思智能发布的多说话人自动语音识别模型MOSS-Transcribe-Diarize在语音识别与分析领域取得突破性进展。该模型由复旦邱锡鹏团队研发，能够同时完成语音转文字...

AIGC动态

4个月前

“在数学上，中国模型没输过”！DeepSeek 深夜屠榜，Math V2 以碾压姿态终结“最强数学模型”之争

11月27日晚，DeepSeek在未提前预告的情况下开源了数学推理模型DeepSeek-Math-V2，其685B参数规模成为业内首个达到国际奥林匹克数学竞赛（IMO）金牌水平且全面...

AIGC动态

6个月前

2M大小模型定义表格理解极限，清华大学崔鹏团队开源LimiX-2M

在AI领域，大语言模型（LLM）虽在非结构化数据处理上表现卓越，却在结构化表格数据建模中长期难以超越传统梯度提升方法。这一现象引发了关于深度学习在结构化...

AIGC动态

6个月前

一颗芯片的新战争

每年9月通常是手机新品发布的高峰期，但今年科技界的焦点已转向AI推理芯片领域的激烈竞争。随着AI应用从训练转向商业化落地，推理市场正迎来爆发式增长。麦肯...

AIGC动态

8个月前

CUDA内核之神、全球最强GPU程序员？OpenAI的这位幕后大神是谁

在AI领域，聚光灯往往聚焦于明星人物，但幕后工程师的关键贡献同样不可忽视。OpenAI资深工程师Scott Gray因其卓越的GPU编程能力成为近期焦点。他编写的CUDA K...

AIGC动态

8个月前

雷军为什么不学「友商」卷智驾？

2月27日晚，小米SU7 Ultra以52.99万元的起售价正式发布，比四个月前预售价降低28.5万元的定价策略引发市场震动。这款售价超过50万元的产品，不仅刷新了小米品...

AIGC动态

1年前 (2025)

标签：性能突破

Claude最强领域被GPT反超！GPT 5.5最难编程基准破0

ChatGPT那一套要过时了？翁荔实测创业首个模型，回合制AI被“原生实时交互”秒了

比人类专家快2倍，斯坦福联合英伟达发布TTT-Discover：用「测试时强化学习」攻克科学难题

击败GPT、Gemini，复旦×创智孵化创业团队「模思智能」，语音模型上新了

“在数学上，中国模型没输过”！DeepSeek 深夜屠榜，Math V2 以碾压姿态终结“最强数学模型”之争

2M大小模型定义表格理解极限，清华大学崔鹏团队开源LimiX-2M

一颗芯片的新战争

CUDA内核之神、全球最强GPU程序员？OpenAI的这位幕后大神是谁

最新W4A4KV4全量化框架，单卡A100大模型推理速度飙升

雷军为什么不学「友商」卷智驾？

热门网址

标签：性能突破

AstronClaw

LibTV-AI视频创作

AI大学堂

热门网址