标签:模型

DeepSeek V3“小版本更新”背后,V3和R1正在融合成一个模型

DeepSeek在3月24日发布了V3的小版本迭代“DeepSeek-V3-0324”,并在3月25日晚发布了官方报告。此次更新主要聚焦于推理能力、前端开发能力、中文写作能力和中文...

“不用高级GPU”!蚂蚁用国产AI芯片狂降百万训练成本,模型性能还与DeepSeek相当

蚂蚁集团在人工智能领域取得了显著进展,通过使用国产芯片和优化技术,成功降低了人工智能模型的训练成本。具体而言,蚂蚁集团在训练“专家混合”(MoE)模型时...

32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强

阿里通义千问Qwen发布了最新视觉语言模型Qwen2.5-VL-32B-Instruct,进一步扩展了其开源家族的产品线。该模型在尺寸和性能之间取得了平衡,能够在本地运行,并...

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

DeepSeek-V3-0324的发布标志着AI领域的一次重要升级。该模型拥有6850亿参数,虽然参数增幅不大,但在代码和数学推理能力上取得了显著提升。特别是在代码领域...

DeepSeek 发布 V3 模型更新:除了编程能力大幅提升,还有更宽松的开源协议

DeepSeek V3 模型的最新更新在编程能力上取得了显著提升,尤其是在前端编码方面。此次更新虽然是小版本升级,但已经在其官方网页、App 小程序等入口开放。新...

万字探讨Agent发展真方向:模型即产品,Agent的未来要靠模型而不是Workflow

Alexander Doria,知名 AI 工程师和 Pleias 的联合创始人,近期发表了两篇文章,深入探讨了 AI 智能体的未来发展方向。他明确指出,未来的 AI 智能体将依赖于...

硅基流动:关于 DeepSeek-R1 API 的评测,至少有 7 个误区

随着硅基流动等平台上线DeepSeek-R1,市面上出现了大量关于API服务的评测文章,但这些评测往往存在诸多误区,导致结论不一致甚至相互矛盾。评测API服务时,测...

多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代

昆仑万维近期发布了Skywork R1V系列模型,这一多模态思维链推理模型在视觉推理和通用推理能力上达到了SOTA级别,成为国内首家开源多模态思维链推理模型的企业...

全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开

昆仑万维近日发布了全球首个开源的多模态推理大模型Skywork R1V(简称R1V),该模型拥有38B参数,性能直逼DeepSeek-R1,并在多项基准测试中取得了领先的成绩...

华人团队提出「CoD」草稿链,减少 80% Token,AI 省钱第一名!

在AI领域,大规模语言模型(LLMs)已经展示了强大的推理能力,但高昂的计算成本和延迟问题依然是一个重大挑战。最近,Zoom的研究团队提出了一种全新的推理范...
1 5 6 7 8 9 13