
文章摘要
在2025世界人工智能大会(WAIC 2025)上,上海AI实验室发布了新一代科学多模态大模型Intern-S1,标志着人工智能在科研领域的重大突破。Intern-S1不仅多模态能力全球开源第一,其科学能力全模态达到国际领先水平,综合性能成为当前开源模型的最优。这一模型融合了语言和多模态性能,实现了高水平均衡发展,具备”全能高手”的实力,同时在化学、材料、地球等多学科专业任务基准上超越了顶尖闭源模型Grok-4。
Intern-S1的创新之处在于其开创了”多任务的通专融合”新范式。通过支持大规模多任务强化学习齐头并进,模型在保持能力全面的同时实现了专业精通。这一突破解决了传统单一模态分析在跨学科领域深度探索中的局限性,为科研工作者提供了更强大的工具。模型首创的”跨模态科学解析引擎”可精准解读化学分子式、蛋白质结构、地震波信号等多种复杂科学模态数据,使AI从”对话助手”进化为”科研搭档”。
在技术实现上,Intern-S1通过架构创新解决了科学数据处理的关键挑战。新增的动态Tokenizer和时序信号编码器支持多种复杂科学模态数据的深度融合,对化学分子式的压缩率相比DeepSeek-R1提升70%以上。同时,研究团队提出的通专融合科学数据合成方法,利用海量通用科学数据拓展模型知识面,并通过专业验证智能体进行数据质量控制,形成闭环机制持续反哺基座模型。
Intern-S1的研发还实现了训练成本的大幅降低,其强化学习训练成本相比近期公开的MoE模型降低10倍。这一成果得益于训练系统与算法层面的协同突破,包括自研推理引擎进行FP8高效率大规模异步推理,以及提出的Mixture of Rewards混合奖励学习算法。模型在系统复杂度和稳定性方面取得的进展,为后续研究提供了重要参考。
上海AI实验室同步开源了完整的工具链体系,包括数据处理、预训练、微调、部署、评测与应用等关键环节的核心工具。基于Intern-S1的多智能体虚拟疾病学家系统”元生”已在肝癌和结直肠癌治疗领域发现新靶点,并经实验验证形成科学闭环。这一成果展示了模型在生物医学领域的实际应用价值。
Intern-S1的实际表现验证了其卓越能力。在化学式识别测试中,模型准确识别出顺式-2,5-二甲基哌嗪和对碘溴苯的化学式,而Grok则出现错误。此外,模型还能以科学逻辑对艺术作品进行理性赏析,展现了跨领域的理解能力。上海AI实验室表示将持续推进Intern-S1及其全链条工具体系的开源,支持免费商用,与各界共同打造更懂科学的AI助手。
原文和模型
【原文链接】 阅读原文 [ 3004字 | 13分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★