大模型
LLM,VLM,模型
无需再训练微调,一个辅助系统让GPT-5.2准确率飙到创纪录的75%
决定AI性能上限的关键因素正从底座模型转向外围的「推理编排」系统。最新研究显示,在大型语言模型(LLM)完全不变的情况下,仅通过优化推理编排系统就能显著...
圣诞写代码,AI谁最强?M2.1、GLM-4.7、K2正面硬刚
2025年圣诞节前夕,MiniMax在IPO冲刺阶段高调发布新一代文本模型M2.1,并通过与智谱GLM-4.7、月之暗面Kimi K2的实测对比展现技术实力。 测试设计三个编程任务...
腾讯按下AI加速键,人才、组织、开源动作密集
腾讯在2025年尾声加速AI领域布局,通过人才引进、组织架构调整和技术迭代释放明确信号。前OpenAI研究员姚顺雨加入腾讯,出任首席AI科学家,直接向总裁汇报,...
超越谷歌,全球第一!上交AI科学家王者归来,登顶OpenAI MLE-bench
由SciMaster团队推出的AI机器学习专家ML-Master 2.0基于国产开源大模型DeepSeek,在OpenAI权威基准测试MLE-bench中击败Google、Meta、微软等国际团队,刷新全...
游戏AI来了!英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达
英伟达开发的NitroGen模型通过观看4万小时带有手柄画面的游戏直播,建立了从视觉输入到操作输出的直接映射。这一突破性方法摒弃了传统AI依赖游戏后台数据的模...
“Cursor的bug太多了,他们直接买下一家代码评审公司来修!”
Cursor宣布收购代码评审初创公司Graphite,旨在整合AI编程与代码审查能力,应对工程团队面临的评审瓶颈问题。 两家公司的核心共识在于:AI加速代码生成的同时...
破除“金融特化”迷思:AI 大模型能否重构投资“不可能三角”?| GAIR Live 021期预告
关于金融特化模型的存续价值,讨论呈现两极观点。一方面,通用模型展现出的零样本学习能力确实降低了领域适配成本;但另一方面,金融场景特有的监管要求、风...
火爆全网的AI片场探班玩法,手把手教会你。
AI视频技术近期在小红书和X平台上引发热潮,用户通过AI工具实现与明星、影视角色在虚拟片场的合影互动。这一玩法通过三个核心步骤实现:提示词生成图片、首尾...
AGI不是一个模型,可能是拼凑的!谷歌DeepMind提出分布式AGI假说
通用人工智能(AGI)的发展路径可能并非依赖单一超级智能模型,而是通过多个专业化子模型的协作实现。谷歌DeepMind团队近期提出的分布式AGI安全框架挑战了传...
超前布局协和10年,这家国产AI「三冠王」终于藏不住了
医疗AI正从工具蜕变为临床协助者,云知声的山海·知医大模型5.0在权威医疗评测MedBench4.0中斩获大语言模型、多模态模型和智能体评测「三冠王」。这一成就标志...




