文章摘要
【关 键 词】 AI科研、OpenAI、大语言模型、科学协作、技术优化
OpenAI最新发布的AI科研平台Prism由GPT-5.2驱动,面向科学家免费开放,标志着该公司正式进军科研领域。该平台允许研究人员将ChatGPT列为合著者,体现了AI在科研协作中的深度整合。OpenAI副总裁Kevin Weil强调,公司的目标是赋予科学家”AI超能力”,加速科研进程,使2030年就能开展2050年的研究。这一愿景与OpenAI更宏大的通用人工智能(AGI)使命相契合,Weil认为AGI对人类最重大的价值在于推动科学进步,可能催生新药物、材料和器械。
在技术能力方面,GPT-5系列展现出显著进步。最新版本GPT-5.2在专业基准测试GPQA中的正确率达到92%,远超GPT-4的39%。这些模型已能解决研究生阶段的物理难题,甚至在国际数学奥林匹克竞赛中取得金牌级成绩。然而,其实际创新能力仍存争议。虽然GPT-5.2Pro成功破解了一道埃尔德什猜想,但多数情况下,模型主要是从已有文献中挖掘解决方案,而非做出真正原创性发现。Weil承认当前模型尚不能取得颠覆性突破,但强调整合被遗忘的知识本身就能加速科研,让研究者不必重复解决已存在的问题。
科研人员的使用反馈呈现两极分化。支持者如范德堡大学教授Robert Scherrer指出GPT-5解决了其团队数月未解的难题;杰克逊实验室的Derya Unutmaz表示大语言模型将数据分析时间从数月缩短至即时。但批评者如加州大学伯克利分校的Nikita Zhivotovskiy认为模型主要整合现有成果,而非创造新方法。更严峻的问题是模型的错误输出,如量子力学家Jonathan Oppenheim发现的案例显示,GPT-5可能提出完全错误的实验方案,而这类错误往往难以察觉。
针对这些问题,OpenAI正着力优化模型设计。关键方向是降低模型置信度,培养”认知谦逊”,使其以”以下思路可供参考”而非绝对肯定的方式提供建议。另一创新是让GPT-5对自身输出进行事实核查,建立类似谷歌DeepMind AlphaEvolve的双模型校验机制。这些改进旨在平衡模型的创造性与可靠性,使其更符合科研需求。
尽管面临谷歌DeepMind等先行者的竞争,OpenAI通过Prism平台展现了差异化定位:不仅提供工具,更构建完整的科研协作生态系统。Weil预测,到2026年,AI辅助科研将如同当今AI编程一样普及,不用AI的研究者可能落后。然而,真正考验在于模型能否从知识整合者进化为科学发现者,这需要突破现有技术局限,实现更深刻的认知飞跃。当前,OpenAI的科研布局更多是抢占赛道,实质性的科学革命仍有待未来技术突破。
原文和模型
【原文链接】 阅读原文 [ 5115字 | 21分钟 ]
【原文作者】 AI前线
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★



