标签:性能
小米入局大模型赛道!开源MiMo-7B,性能超o1-mini
小米近日宣布进军大模型领域,并开源了一款名为MiMo-7B的模型。尽管MiMo-7B仅有70亿参数,但其在多个测试中表现优异,在数学AIME24/25中分别达到68.2分和55.4...
发布 Qwen3,阿里云拉开新一轮开源模型竞赛的序幕
2025年,AI领域的发展呈现出开源与创新加速的趋势。2月,DeepSeek的R1模型引发全球关注,将焦点集中在“中国”和“开源”上。4月,Meta宣布举办LlamaCon开发者大...
Qwen3发布!超DeepSeek R1登顶开源榜,还带来了跟R1不同配方
阿里巴巴于4月29日凌晨发布了新一代通义千问Qwen3系列模型,涵盖8款不同尺寸,其中旗舰模型Qwen3 235B采用混合专家(MoE)架构,总参数量为235B,激活参数仅...
刚刚,Qwen3 终于发布!混合推理模式、支持MCP,成本仅DeepSeek R1三分之一,网友喊话小扎:工程师要赶紧加班了
阿里巴巴发布了新一代通义千问模型 Qwen3,该模型采用混合专家(MoE)架构,总参数量为 235B,但激活仅需 22B,显著降低了成本。Qwen3 在性能上全面超越了 De...
猛击OpenAI o1、DeepSeek-R1!刚刚,阿里Qwen3登顶全球开源模型王座,深夜爆火
Qwen3系列模型正式发布,采用Apache2.0协议开源,全球开发者、研究机构和企业均可免费下载并商用。该系列包含两款MoE模型和六款密集模型,每款模型又分为基础...
阿里千问 3 登顶全球最强开源模型,性能超越 DeepSeek-R1、OpenAI-o1
阿里巴巴最新发布的开源模型Qwen3(通义千问3)在性能、成本和灵活性方面取得了显著突破,成为全球最强开源模型。该模型采用混合专家(MoE)架构,总参数量为...
秒杀同行!Kimi开源全新音频基础模型,横扫十多项基准测试,总体性能第一
Kimi-Audio 是一个全新的通用音频基础模型,支持语音识别、音频理解、音频转文本、语音对话等多种任务,在多个音频基准测试中实现了最先进的性能。结果显示,...
苹果彻底改变了这颗芯片
自蒂姆·库克发布Apple Silicon芯片以来,苹果在计算领域迈出了重要的一步。这一转变源于苹果与英特尔合作中的诸多问题,尤其是在芯片性能、功耗和散热方面的...
Agent 要被吃进大模型了
OpenAI近期发布了全新的o系列模型,包括满血版o3和o4-mini,这两款模型在性能和价格上均实现了显著提升。o3在多个基准测试中刷新了纪录,尤其在编程、商业咨...
GPT-4.1全网实测来袭,惨遭谷歌Gemini碾压!大佬猜测:从GPT-4.5蒸馏的
GPT-4.1模型的发布标志着OpenAI在AI领域的最新进展,尽管其性能在某些方面超越了前代模型,但在与谷歌的Gemini 2.5 Pro的竞争中仍显不足。GPT-4.1以其强大的...