标签:模型
比R1快8倍、价格仅3%,智谱新推理模型来袭,能让免费智能体自己赚钱!张鹏:Agent 也有Scaling Law
智谱公司近期发布了最新的AutoGLM沉思模型,该模型不仅具备深度研究能力,还能执行实际操作任务,展示了AI智能体的全新发展方向。AutoGLM沉思模型的核心在于...
独家|对话蚂蚁 Ling 团队:聊聊用国产卡降本这回事儿
蚂蚁团队近期开源了两个MoE模型——Ling-Lite和Ling-Plus,并发布了技术论文《Every Flop Counts》。Ling-Lite拥有168亿参数,激活了27.5亿参数;Ling-Plus则拥...
网上晒图要当心!AI六成可能知道你在哪儿
AI在图像地理识别任务中表现出色,准确率远超人类,但也暴露了显著的偏差和隐私问题。 研究表明,视觉语言模型(VLMs)能够通过图像细节推断地理位置,表现最...
OpenAI破大防,拒绝率从98%骤降2%!陈怡然团队提出全新思维链劫持攻击
随着大型推理模型(LRMs)的快速发展,其推理能力和安全性之间的平衡成为关键问题。近期研究表明,模型的安全审查透明化反而成为其弱点,攻击者可以通过「思...
OpenAI 宣布采用竞对 Anthropic 协议,一夜将 MCP 送上热搜!Karpathy:赶紧歇了吧
OpenAI CEO Sam Altman 确认将在其产品中集成 Anthropic 的模型上下文协议(MCP),这一协议旨在通过标准化接口连接数据源与 AI 应用,从而提升 AI 系统的灵...
DeepSeek V3“小版本更新”背后,V3和R1正在融合成一个模型
DeepSeek在3月24日发布了V3的小版本迭代“DeepSeek-V3-0324”,并在3月25日晚发布了官方报告。此次更新主要聚焦于推理能力、前端开发能力、中文写作能力和中文...
“不用高级GPU”!蚂蚁用国产AI芯片狂降百万训练成本,模型性能还与DeepSeek相当
蚂蚁集团在人工智能领域取得了显著进展,通过使用国产芯片和优化技术,成功降低了人工智能模型的训练成本。具体而言,蚂蚁集团在训练“专家混合”(MoE)模型时...
32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
阿里通义千问Qwen发布了最新视觉语言模型Qwen2.5-VL-32B-Instruct,进一步扩展了其开源家族的产品线。该模型在尺寸和性能之间取得了平衡,能够在本地运行,并...
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑
DeepSeek-V3-0324的发布标志着AI领域的一次重要升级。该模型拥有6850亿参数,虽然参数增幅不大,但在代码和数学推理能力上取得了显著提升。特别是在代码领域...
DeepSeek 发布 V3 模型更新:除了编程能力大幅提升,还有更宽松的开源协议
DeepSeek V3 模型的最新更新在编程能力上取得了显著提升,尤其是在前端编码方面。此次更新虽然是小版本升级,但已经在其官方网页、App 小程序等入口开放。新...