标签:性能提升

FlashAttention-4正式发布:算法流水线大改,矩阵乘法级速度

经过一年开发,深度学习底层优化技术FlashAttention推出大版本更新FlashAttention-4,专门适配新一代Blackwell架构GPU。在Blackwell GPU上,注意力机制的执行...

让搜索Agent不「傻等」:人大团队依托扩散模型实现「一心二用」,边等搜索结果边思考,加速15%性能不减

传统搜索Agent普遍采用ReAct框架,执行流程为严格串行的想→调工具→等结果→再想→再调工具→再等……,每轮“思考”与“调用工具”环节完全串行,等待搜索引擎返回结果...

重复一下提示词,Gemini准确率竟从21%飙升至97%!

Google Research团队的最新研究发现,通过简单重复输入提示词,可以显著提升主流大语言模型在非推理任务上的表现。这一策略在不增加计算延迟的前提下,使Gemi...

无需再训练微调,一个辅助系统让GPT-5.2准确率飙到创纪录的75%

决定AI性能上限的关键因素正从底座模型转向外围的「推理编排」系统。最新研究显示,在大型语言模型(LLM)完全不变的情况下,仅通过优化推理编排系统就能显著...

GPT-5.2来了!首个「专家级」AI复仇成功,牛马打工人终于得救了

OpenAI近日发布了新一代GPT-5.2系列模型,包含Instant、Thinking和Pro三个版本,在多项专业任务中展现出显著优势。该系列模型在通用智能、长文本理解、工具调...

Meta超级智能实验室又发论文,模型混一混,性能直接SOTA

大语言模型(LLM)的训练通常依赖大量算力和时间资源,而模型Souping(Model Souping)作为一种轻量级方法,通过对同一架构的多个模型进行权重平均,能够融合...

这类SSD,国内首款

从1976年2MB的RAM-SSD到2007年32GB SSD进入笔记本,再到如今PCIe Gen4×4接口的普及,固态硬盘(SSD)的容量、体积和形态经历了革命性变革。江波龙最新推出的...

「性价比王者」Claude Haiku 4.5来了,速度更快,成本仅为Sonnet 4的1/3

Anthropic近期发布了轻量级AI模型Claude Haiku 4.5,主打「更便宜、更快速」的特点。该模型在编码性能上可与中高端模型Claude Sonnet 4媲美,但成本仅为后者...

Anthropic新模型杀疯了!成本直降 2/3、性能直逼GPT-5,用户实测:比“吹”的还强,速度超 Sonnet 3.5 倍

Anthropic正式发布Claude Haiku 4.5模型,该版本作为其最小型模型的最新迭代,现已面向所有用户开放。官方宣称其性能接近Sonnet 4,但成本仅为后者的三分之一...

库克在抖音卖iPhone,M5芯片却偷偷上MacBook Pro,网友:没有Pro/Max,你咋敢?

苹果公司最新发布的M5芯片将率先应用于MacBook Pro、iPad Pro和Apple Vision Pro三款设备。这款芯片采用台积电第三代3nm工艺,配备10核GPU架构和神经网络加速...
1 2 3 16