标签:大模型
大模型一体机塞进这款游戏卡,价格砍掉一个数量级
大模型一体机中使用的显卡类型引发了广泛关注,尤其是英特尔锐炫™显卡的引入,为市场带来了新的选择。尽管在性能上,搭载NVIDIA显卡的一体机在任务处理速度上...
阿里云造“Agent工厂”,百炼MCP服务上线,无需代码5分钟人人都可搭建Agent
在阿里云AI势能大会上,阿里云智能集团资深副总裁刘伟光介绍了AI大模型在企业市场中的最新应用成果和趋势。AI大模型在咖啡店的应用不仅限于设计宣传海报或制...
拿 20 年前的苹果“古董”笔记本跑模型推理:九分之一现代 CPU 速度,但成功了!
软件工程师 Andrew Rossignol 成功在一台已有 20 年历史的 PowerBook G4 笔记本电脑上运行了生成式 AI 模型,展示了旧硬件与现代 AI 技术的兼容性。这台笔记...
四个维度深入剖析「 Test-Time Scaling 」!首篇系统综述,拆解推理阶段扩展的原理与实战
随着大模型训练成本的急剧攀升和优质数据的逐渐枯竭,推理阶段扩展(Test-Time Scaling, TTS)技术迅速成为后预训练时代的关键突破口。与传统的“堆数据、堆参...
1000万上下文!新开源多模态大模型,单个GPU就能运行
今年2月初,谷歌发布的Gemini 2.0 Pro支持200万上下文,震惊了整个大模型领域。然而,仅过了2个月,Meta最新开源的Llama 4 Scout就将上下文扩展至1000万,整...
谷歌等最新研究,合成数据可将大模型数学推理提升8倍
随着大模型如ChatGPT的快速发展,对高质量训练数据的需求呈指数级增长,预计最快将在2026年耗尽现有的300万亿tokens的公开数据集。为了解决这一问题,合成数...
Cursor劲敌来了
Augment Code 最新发布的 Augment Agent 是一款专为大型项目程序员设计的 AI 编程助手,旨在提升开发效率和代码质量。Augment Code 由前微软高级软件开发工程...
从DeepSeek崛起到下一个亿级销量市场,这份硬核报告说明白了
2025年标志着中国在前沿科技领域的崛起,尤其是在AI大模型、算力优化、机器人应用和量子计算等方面取得了显著突破。从DeepSeek到Manus,中国科技企业不仅在国...
Agent 正在重新划分大模型竞争格局
大模型与强化学习是Agent的核心技术,决定了其自主性和执行能力。Agent作为人工智能时代的“AI Being”,能够完成从理解任务、思考推理到决策执行的全流程,区...
智谱CEO张鹏:开源不等于真的免费,我们还在做预训练|钛媒体AGI
智谱发布了首个免费且具备深度研究和操作能力的AI Agent智能体产品AutoGLM沉思,以及32B参数规模的开源GLM-Z1-Air模型。AutoGLM沉思能够像人类一样进行复杂思...