大模型
LLM,VLM,模型
LLM又曝致命缺陷:根本不会看时钟!博士惊呆,准确率不及50%
最新研究揭示了AI在处理看似简单的任务时存在的显著认知缺陷,尤其是在读取时钟和判断日期方面。尽管AI在复杂任务如论文写作、绘画和考试中表现出色,但在这...
华为+DeepSeek,推理性能创新高!技术报告也公布出来了
华为昇腾在超大规模MoE模型推理部署领域取得了显著突破,其推理性能全面超越了英伟达的Hopper架构。这一成就主要归功于华为昇腾的“以数学补物理”策略,通过数...
Index-AniSora:B站开源动画生成模型,斩获多项SOTA入选IJCAI25
B站近期开源了名为Index-AniSora的动画视频生成模型,该模型专为二次元风格视频设计,支持多种类型的动画生成,包括番剧、国创、漫改动画、VTuber、动画PV和...
“核弹”级升级!英伟达最强GB300 AI工厂性能提升5000%,黄仁勋:AI算力每10年提高100万倍
在Computex 2025电脑展上,英伟达CEO黄仁勋发布了一系列重磅产品,进一步巩固了英伟达在AI基础设施领域的领导地位。全新NVIDIA GB300 NVL72平台成为焦点,该...
三金,又是中国队!全球机器人视触融合挑战赛揭榜
在2025年ICRA国际会议上,ManiSkill-ViTac视触觉融合挑战赛揭晓了最终结果,全球42支顶尖团队参与了这场激烈的角逐。中国团队表现尤为突出,包揽了三个赛道的...
OpenAI:GPT-5就是All in One,集成各种产品
OpenAI在发布“最强编程智能体Codex”后,通过Reddit的“有问必答”活动,进一步透露了关于下一代基础模型GPT-5的规划。公司研究副总裁Jerry Tworek表示,未来计...
通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API
阿里通义实验室最近开源了ZeroSearch,这是一个无需与真实搜索引擎交互的强化学习框架,旨在提升大模型的检索和推理能力。传统的强化学习方法依赖于真实搜索...
谷歌超强 AI Agent 登场:攻克 300 年数学难题、改进芯片设计!编程迎来 AlphaGo 时刻?
谷歌DeepMind最新发布的AlphaEvolve系统,标志着人工智能在算法开发和数学研究领域的重大突破。该系统由Gemini驱动,结合了创造性问题解决能力和自动评估机制...
刚刚,OpenAI最强编程智能体上线ChatGPT!AI的「终极外挂」来了
OpenAI 正式发布了 Codex,这是一款基于云端运行的软件工程智能 Agent,旨在协助开发者高效完成编程任务。Codex 的核心功能包括编写功能代码、理解代码结构、...
卡内基梅隆大学开源LegoGPT,用AI设计乐高模型
卡内基梅隆大学近期开源了LegoGPT,这是一种能够根据文本提示生成物理乐高模型的创新方法。LegoGPT的推出填补了从自由形式文本提示直接生成乐高设计的空白,...





