大模型

LLM,VLM,模型

MCP:构建更智能、模块化 AI 代理的通用连接器

大语言模型驱动的人工智能代理虽潜力巨大,但集成外部组件面临挑战,模型上下文协议(MCP)应运而生,为解决这些问题提供了有效方案。MCP 是 2024 年底由 Ant...

将KV Cache预算降至1.5%!他们用进化算法把大模型内存占用砍下来了

键值缓存(KV cache)是大模型快速运行的核心技术,但存在输入文本越长、所需存储空间越大且处理长文本变慢的问题。现有 KV cache 压缩方法主要依赖基于规则...

机器人入职洗衣房,开始打工挣钱!苹果前AI高管打造

机器人Isaacs已在付费洗衣房Tumble Laundry上岗,开启机器人叠衣服赚钱的新尝试。Isaacs由前苹果团队创立的Weave Robotic打造,该团队在产品未正式亮相时就完...

Meta开源MobileLLM-R1模型,不到1B参数,用1/10的训练就超越了Qwen3

Meta AI 团队本周五正式发布了 MobileLLM-R1,这是 MobileLLM 的全新高效推理模型系列,引发了机器学习社区的讨论。MobileLLM-R1 包含基础模型 MobileLLM-R1 ...

清华、上海AI Lab等顶级团队发布推理模型RL超全综述,探索通往超级智能之路

强化学习(RL)在人工智能发展中一直是重要方法,自1998年概念提出后,在多个领域取得显著成果。进入大模型时代,RL最初用于让模型更符合人类偏好,近年来研...

用户退订、封锁中国,Claude Code亲手送出的“泼天富贵”,腾讯CodeBuddy来接了?

Claude Code曾是备受追捧的AI编程工具黑马,但近期却让全球开发者失望。开发者 Ahmad 在推上细数其“数宗罪”,如 Claude Code 里没有 opus 4、周用量限制却不...

突遭制裁!美国政府将复旦微电等23个中国实体列入“黑名单”,清单总量已超千家

当地时间9月12日,美国商务部工业与安全局(BIS)修订《出口管理条例》,将32个实体添加到管制实体名单,其中23家为中国实体,包括复旦微电、中国科学院空天...

突发!苹果AI大失血:Siri前掌门离职,核心团队被挖角,新功能延期到2026

苹果AI发展近半年来在跌宕中失速,引发外界诸多疑问。前Siri负责人、AI资深高管Robby Walker即将离任。Walker自2022年起负责语音助手Siri,但今年早些时候因...

阿里美团的外卖大战正变成AI大战

阿里与美团在本地生活服务领域的竞争正不断升级,AI成为这场竞争的关键变量。高德发力本地生活,推出真实榜单:9月10日阿里巴巴26周年时,高德地图以“高德扫...

Claude 官方发文:如何给 Agent 构建一个好用的工具?

Claude 新增创建和编辑主流办公文件的功能,拓展了 AI 应用场景。Anthropic 分享了开发和优化智能体工具的经验与方法论。转变设计思维:要为不确定、会推理的...
1 14 15 16 17 18 697