标签:性能提升

节前重磅:开源旗舰模型新SOTA,智谱GLM-4.6问世

智谱AI正式发布新一代旗舰模型GLM-4.6,该模型在多个技术维度实现显著突破。作为GLM系列的最新版本,GLM-4.6不仅延续了开源策略(采用MIT协议),更在编码能...

Anthropic 深夜祭出 Claude Sonnet 4.5,能自主连续工作 30 小时!CEO:它更像你的同事

Anthropic公司正式发布新一代人工智能模型Claude Sonnet 4.5,官方宣称其为'世界上最好的编码模型',标志着AI技术从辅助工具向独立生产力迈进的关键一步。该...

高通祭出全球最快移动SoC!卢伟冰携全球首发小米17Pro现身

2025 年在古北水镇举办的骁龙峰会·中国会场,高通推出最新移动旗舰 SoC——第五代骁龙 8 至尊版移动平台(骁龙 8 Elite Gen 5),采用台积电 3nm 制程工艺,首...

联发科天玑9500升级主机级游戏技术,抬高手游体验天花板

联发科自2019年发布“天玑”品牌后,在手机芯片高端市场成绩斐然,连续五年占据全球智能手机SoC市场份额第一,旗舰芯片表现尤其出色。天玑9000系列出货量持续增...

将KV Cache预算降至1.5%!他们用进化算法把大模型内存占用砍下来了

键值缓存(KV cache)是大模型快速运行的核心技术,但存在输入文本越长、所需存储空间越大且处理长文本变慢的问题。现有 KV cache 压缩方法主要依赖基于规则...

英伟达的AI已经开始接管整个项目了?SATLUTION自主进化代码库登顶SAT竞赛

AI在软件开发领域的应用取得了重要进展,NVIDIA Research的研究人员提出的SATLUTION框架,将LLM代码进化能力从“算法内核”扩展到“完整代码库”规模,在布尔可满...

字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%

字节跳动最近开源了一种新的图像编辑方法,名为SuperEdit,该方法在性能上比当前最先进的图像编辑方法提高了9.19%,同时仅使用了1/30的训练数据和1/13的模型...

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

扩散模型在推理任务中的表现正逐渐受到关注,尤其是通过强化学习(RL)方法的应用。传统上,自回归大语言模型(LLM)在推理任务中占据主导地位,但离散扩散大...

OpenAI深夜上线o3满血版和o4 mini – 依旧领先。

OpenAI在直播中正式发布了o3和o4-mini模型,取代了之前的o1、o3-mini和o3-mini-high。ChatGPT Plus、Pro和Team用户从即日起可以在模型选择器中看到这些新模型...

强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展

「推理」已成为语言模型的下一个主要前沿领域,学术界和工业界在探索模型推理性能提升的过程中,提出了一个核心问题:什么方法有效,什么方法无效?近期研究...
1 2 3 4 16