标签:大模型
智元曝光「机器人大模型」,但真正的核心,并不是机器人!
智元机器人近期发布的通用具身基座大模型GO-1,标志着机器人行业迈向了一个新的里程碑。GO-1的核心优势在于其强大的泛化能力和极简学习机制,能够在极少数据...
LG发布NEXUS框架,用AI确保训练数据合规性
数据作为预训练大模型的基石,其合规性至关重要。传统的合规评估方法主要依赖于表面的许可条款,忽略了数据集在再分发、合并和转换过程中的复杂性,导致许多...
阿里开源新模型:媲美DeepSeek-R1,参数大降20倍!
阿里巴巴近日开源了其最新的大模型QwQ-32B,该模型支持Apache 2.0开源协议,允许商业化使用。QwQ-32B在多个主流测试基准中表现优异,能够与DeepSeek的R1-671B...
7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源!
随着大模型在形式化证明写作中的需求日益增长,形式化推理与验证(formal reasoning and verification)逐渐成为研究的焦点。然而,现有的形式化推理大模型大...
DeepSeek 之后,大模型应用如何迈向新阶段?| AICon
春节期间,DeepSeek 在全球范围内引发了广泛关注,其开源特性、成本优势和回复准确率受到高度评价,推动了云计算领域的新热潮。企业纷纷接入 DeepSeek,导致...
千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷
法国大模型独角兽 Mistral AI 近期推出了其光学字符识别(OCR)产品 Mistral OCR,号称是“世界上最好的 OCR 模型”。该模型以图像和 PDF 作为输入,能够以前所...
DeepSeek创造历史!登顶全球AI应用第2名,豆包排名第10
全球著名投资基金Andreessen Horowitz(a16z)发布了2025年全球100生成式AI应用排行榜,分为网页版和移动版各50个应用。在网页版中,DeepSeek排名第二,仅次...
机器人到来前,智能汽车可能是更早服务人类的 AI Agent
在智能化转型的浪潮下,汽车行业正逐步深入AI领域,探索如何将AI技术与汽车产品深度融合。2025年被视为一个关键节点,众多车企纷纷接入DeepSeek等AI模型,宣...
DeepSeek的MLA,任意大模型都能轻松迁移了
DeepSeek-R1作为AI产业颠覆式创新的代表,其训练与推理成本仅为同等性能大模型的数十分之一,核心在于多头潜在注意力网络(MLA)。MLA通过对键值缓存进行低秩...
阿里开源QwQ-32B,性能比肩R1。这是一次压倒性的创新。
阿里巴巴最新发布的推理模型QwQ-32B,以其320亿参数的规模,展现了与6710亿参数的DeepSeek-R1相媲美的性能。这一突破意味着,在更小的设备上运行更强大的推理...



