标签:大模型

AI竞赛下半场:忘掉聊天机器人,入口与执行权定生死

当前人工智能行业的竞争焦点已从模型智力转向智能体的入口、上下文和执行权限。大模型提供基础智力,而掌握用户高频使用入口与执行权限才是构建未来商业护城...

硅星人 Eval Eps.2|Fable 5评测:强,贵,甚至能发现自己正在被检测

Anthropic近期推出了Claude Fable 5模型,其底层与Mythos 5相同,并在安全护栏上进行了全面优化。该模型在多项权威基准测试中成绩优异,被业界视为一次阶跃式...

更懂你的ChatGPT来了!通过做梦整理记忆,事实准确率83%

在记忆质量评估方面,新系统在三个核心维度上取得了显著的数据突破。在延续上下文维度,系统能够精准调用历史信息推进复杂长期项目,事实回忆准确率提升至82....

库克最后一届WWDC,把苹果AI九年的地基掀了

苹果在WWDC上宣布用全新专为大模型设计的端侧推理框架Core AI取代服役9年的Core ML,覆盖全平台并原生支持大模型基础能力。全新的Core AI从底层代码重写,统...

万字解读:为何长上下文治不了多模态 AI 的「健忘症」?丨GAIR Live 031

在跨模态检索方面,评测实验表明,多模态长记忆的瓶颈不在于模型的推理层,而在于检索层,只要提供准确的证据,模型准确率可大幅提升。面对长上下文带来的证...

业界首次:DeepSeek-V4 基于国产AI芯片+SGLang RBG的云原生推理方案在招商银行落地

大模型推理正逐渐从单机向分布式集群和分离式架构演进,但传统的Kubernetes工作负载原语难以满足多角色协作、拓扑敏感及快速可靠升级等复杂推理场景的需求。...

独家对话OPPO姜昱辰:基模不是手机厂商的生意,目标是个人Agent

在人工智能浪潮的推动下,大模型厂商与传统手机厂商纷纷布局AI手机市场,行业竞争日益激烈。面对从智能手机向AI手机的范式转变,手机厂商的核心战略意图在于...

独家解读丨OpenAI 为什么要冒死「脱离群众」?

OpenAI在IPO前夕进行重大商业战略转向,将目标用户从普通消费者转向企业和职场人,致力于将自身改装为To B企业办公平台。通过在Codex中嵌入针对销售、数据分...

首个企业IT运维Agent基准,Claude拿第一也才47%

Artificial Analysis与IBM联合推出了首个专门针对企业级IT任务的智能体基准测试ITBench-AA,旨在填补现有通用评测标准在高度专业化的企业运维领域的空白。该...

阿里RTPurboV2:原生Transformer再次崛起,百步训练实现10倍稀疏注意

随着大模型应用中长序列需求的增加,传统全注意力机制因计算复杂度高而成为性能瓶颈。阿里团队推出了第二代注意力压缩技术,旨在彻底解决全注意力机制在超长...
1 2 3 92