标签:成本
Mistral的首个强推理模型:拥抱开源,推理速度快10倍
欧洲人工智能公司Mistral AI近期发布了全新的大语言模型系列Magistral,该系列展现了强大的推理能力,能够通过不断反思解决更复杂的任务。Magistral系列包含...
AI 编程终结的不是代码,而是作为「容器」的软件
2005年YouTube的「上传」按钮开启了内容创作的民主化时代,而如今,AI通过「描述」这一动词,正在彻底改变软件的认知与生产方式。知名硅谷投资人Chris Paik在...
1.4nm,贵的吓人!
台积电的2纳米制程已吸引苹果、联发科、高通等科技巨头的关注,尽管每片晶圆成本高达3万美元,但这些公司仍愿意投入数十亿美元以保持竞争优势。然而,未来的...
硅谷今夜集体失眠!互联网女皇340页AI报告猛料刷屏,大佬熬夜头秃
互联网女皇Mary Meeker发布的《AI趋势报告2025》引发了广泛关注,报告长达340页,深入探讨了人工智能领域的变革与趋势。AI驱动的变革已经全面且不可逆转,既...
首次披露!DeepSeek V3 发布软硬一体协同训练论文,公开「降成本」秘诀
DeepSeek团队最新发布的论文《洞察 DeepSeek-V3:规模的挑战和对AI架构硬件的思考》探讨了如何通过软硬件协同设计实现经济高效的大规模训练和推理。随着OpenA...
拜拜,昂贵的谷歌搜索 API!阿里开源 RL 框架让大模型自给自足、成本直降88%,网友:游戏规则变了
阿里巴巴的研究人员最近发布了一项名为“ZeroSearch”的新技术,旨在降低训练AI系统进行信息搜索的成本和复杂性,并完全消除对昂贵商业搜索引擎API的需求。这项...
只花9美元,推理能力暴涨20%!小模型Tina震撼登场,成本缩减260倍
南加州大学的研究团队近期发表了一篇名为《Tina: Tiny Reasoning Models via LoRA》的论文,提出了一种通过低秩自适应(LoRA)技术实现的高效推理模型。该模...
人人都能有一个满血DeepSeek?清华90后出手,10万块畅玩FP8原版
一款由清华90后团队打造的AI利器——行云褐蚁一体机,首次实现了以14.9万元的低成本流畅运行满血版DeepSeek模型,并支持顶配的128K上下文,性能媲美百万级方案...
刚刚,Qwen3 终于发布!混合推理模式、支持MCP,成本仅DeepSeek R1三分之一,网友喊话小扎:工程师要赶紧加班了
阿里巴巴发布了新一代通义千问模型 Qwen3,该模型采用混合专家(MoE)架构,总参数量为 235B,但激活仅需 22B,显著降低了成本。Qwen3 在性能上全面超越了 De...
阿里千问 3 登顶全球最强开源模型,性能超越 DeepSeek-R1、OpenAI-o1
阿里巴巴最新发布的开源模型Qwen3(通义千问3)在性能、成本和灵活性方面取得了显著突破,成为全球最强开源模型。该模型采用混合专家(MoE)架构,总参数量为...