AI大模型
LLM,VLM,模型,VLA
「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题
摘要:在机器之心编辑部的专栏中,介绍了牛津大学 VGG 实验室 Andrew Zisserman 团队最新工作,解决了计算机视觉中遮挡问题的挑战。该工作提出了非模态分割(...
田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型
摘要:本文报道了Meta FAIR的田渊栋及其团队最新研究成果,提出了一种名为GaLore的内存高效的LLM训练方法。该方法通过Gradient Low-Rank Projection实现了在...
挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4
摘要:本文报道了美国 AI 创业公司 Inflection AI 发布的新一代大语言模型 Inflection-2.5,该模型结合了强大的LLM能力和Inflection标志性的「同理心微调」,...
驱动产学研深度融合,「未来高新视频智能技术中心创新联合体 」在快手揭牌
在3月1日举办的未来高新视频智能技术创新中心成果汇报会暨创新联合体揭牌仪式上,快手科技展示了其在音视频和人工智能技术领域的最新成果。会议吸引了北京市...
中科院等万字详解:最前沿图像扩散模型综述
中科院联合Adobe和苹果公司的研究人员发布了一篇关于图像编辑中扩散模型的重磅综述。这篇综述全文长达26页,包含1.5万余词,涵盖了297篇文献,全面研究了图像...
消费级显卡可用!李开复零一万物发布并开源90亿参数Yi模型,代码数学能力史上最强
在这篇文章中,介绍了李开复旗下AI公司零一万物发布的新AI模型Yi-9B,该模型拥有90亿参数,被称为Yi系列中的“理科状元”。与其他类似规模的开源模型相比,Yi-9...
人大系初创与OpenAI三次“撞车”:类Sora架构一年前已发论文
金磊和衡宇从凹非寺发来的报道揭示了一个引人入胜的故事,关于一家位于中关村的创业公司——智子引擎,以及它与OpenAI技术上的“撞车”事件。这家公司凭借其在多...
40%算力训练效果比肩GPT-4,实测DeepMind联创大模型创业新成果
摘要:克雷西报道了由DeepMind联合创始人Mustafa Suleyman领导的大模型初创公司Inflection-2.5推出的新产品Pi,以及该公司背后的故事。Inflection-2.5是一款...
她们正在影响AI进程
在国际妇女节之际,量子位公众号QbitAI特别关注了人工智能领域中值得关注的华人女科学家。文章介绍了十位在AI领域取得显著成就的女性,她们在基础算法研究、...
GPT-4王冠没掉!Claude 3竞技场人类投票成绩出炉:仅居第三
摘要:在最新发布的Claude 3竞技场排名中,其最强模型Opus在与GPT-4-Turbo的比拼中取得了令人瞩目的成绩。然而,整体而言,GPT-4系列仍占据着主导地位。竞技...


