标签:大模型
万字解读:为何长上下文治不了多模态 AI 的「健忘症」?丨GAIR Live 031
在跨模态检索方面,评测实验表明,多模态长记忆的瓶颈不在于模型的推理层,而在于检索层,只要提供准确的证据,模型准确率可大幅提升。面对长上下文带来的证...
业界首次:DeepSeek-V4 基于国产AI芯片+SGLang RBG的云原生推理方案在招商银行落地
大模型推理正逐渐从单机向分布式集群和分离式架构演进,但传统的Kubernetes工作负载原语难以满足多角色协作、拓扑敏感及快速可靠升级等复杂推理场景的需求。...
独家对话OPPO姜昱辰:基模不是手机厂商的生意,目标是个人Agent
在人工智能浪潮的推动下,大模型厂商与传统手机厂商纷纷布局AI手机市场,行业竞争日益激烈。面对从智能手机向AI手机的范式转变,手机厂商的核心战略意图在于...
独家解读丨OpenAI 为什么要冒死「脱离群众」?
OpenAI在IPO前夕进行重大商业战略转向,将目标用户从普通消费者转向企业和职场人,致力于将自身改装为To B企业办公平台。通过在Codex中嵌入针对销售、数据分...
首个企业IT运维Agent基准,Claude拿第一也才47%
Artificial Analysis与IBM联合推出了首个专门针对企业级IT任务的智能体基准测试ITBench-AA,旨在填补现有通用评测标准在高度专业化的企业运维领域的空白。该...
阿里RTPurboV2:原生Transformer再次崛起,百步训练实现10倍稀疏注意
随着大模型应用中长序列需求的增加,传统全注意力机制因计算复杂度高而成为性能瓶颈。阿里团队推出了第二代注意力压缩技术,旨在彻底解决全注意力机制在超长...
大人,AI编程又变天了!Claude Code之父、龙虾创始人同时力捧新范式,杀死提示词工程?
在AI编程领域,开发者的工作模式正经历深刻变革,从手动编写提示词转变为设计能够持续调度和约束编程代理的循环系统。这种被称为循环工程的新范式,标志着开...
连续入选ICRA最佳论文,RoboScience机器科学如何突破具身智能泛化瓶颈?
RoboScience机器科学团队在机器人顶级会议ICRA上连续两年获得操作与运动方向最佳论文奖项认可,其研究成果系统性推进了具身智能的技术边界。团队提出的Bi-Ada...
大模型刷爆所有考试,却离AGI更远了:这篇论文拆穿了什么?
当前通用人工智能领域面临定义模糊的困境,业界缺乏统一的衡量标准,导致发展目标如同罗夏墨迹测试般充满主观想象。真正的通用人工智能不应以模仿人类的逼真...
大模型“双雄”回A记
智谱与MiniMax作为目前唯二上市的主流独立大模型厂商,在港股上市半年后相继宣布启动A股科创板IPO进程。两家公司在港股市场的股价表现呈现出差异,智谱凭借B...


