标签:推理

DeepSeek让英伟达H20都被疯抢,但AI推理爆发不只靠囤卡

英伟达H20显卡近期市场需求激增,价格大幅上涨,背后原因是AI推理需求的爆发。尽管H20的性能远不及H100,但其在推理任务中的表现足以满足需求,且价格更为低...

AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025

Manus的出现将智能体推入AI格局的前列,尽管存在争议,但其工程创新仍被视为一种护城河。在AI智能体推理与决策研讨会(AIR 2025)上,多位学术界和工业界的研...

华人团队提出「CoD」草稿链,减少 80% Token,AI 省钱第一名!

在AI领域,大规模语言模型(LLMs)已经展示了强大的推理能力,但高昂的计算成本和延迟问题依然是一个重大挑战。最近,Zoom的研究团队提出了一种全新的推理范...

真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」

最近,智能体(Agent)在AI领域再次成为焦点。2025年1月,OpenAI发布了名为DeepResearch的o3模型变种,专门用于网页和文档搜索。该模型通过强化学习训练,具...

英伟达,暴跌20%

英伟达在2025年开局表现不佳,股价下跌超过20%,市值缩水近万亿美元。尽管公司第四季度收入同比增长78%,达到创纪录的393亿美元,主要得益于数据中心部门的强...

DeepSeek后更大的机遇:AI端侧推理创新 | 智在终端

AI推理时代需要高性能、高能效的芯片设计。高通在终端AI领域的前瞻预判和技术布局使其再次引领了时代之先。高通的定制CPU、NPU、GPU和低功耗子系统构成了其行...

Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

Anthropic最近发布了其最新的AI模型Claude 3.7 Sonnet,该模型在推理能力上表现出色,甚至在某些情况下展现出令人惊讶的决策能力。为了展示其强大的推理能力...

阿里千问QwQ-32B推理模型开源,比肩671B满血DeepSeek-R1!笔记本就能跑

阿里最新发布的QwQ-32B推理模型,凭借320亿参数的表现,成功追平了当前公认的最强开源模型DeepSeek-R1(6710亿参数),并在多项基准测试中超越了o1-mini模型...

全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理

由UCLA等机构组成的研究团队在全球首次实现了在20亿参数的非监督微调模型上进行多模态推理的突破,这一成果被称为DeepSeek-R1的「啊哈时刻」。研究团队在未经...

3140参数Grok-1推理加速3.8倍,PyTorch+HuggingFace版来了

这篇文章介绍了马斯克开源的Grok-1,以及Colossal-AI团队为Grok-1提供的方便易用的Python+PyTorch+HuggingFace版本,能将推理时延加速近4倍。Colossal-AI团队...
1 3 4 5 6