大模型
LLM,VLM,模型
谷歌也要「AI抖音」了!新Veo 3.1原生支持竖屏,4K分辨率高画质
谷歌最新升级的Veo 3.1视频生成模型,标志着其在AI短视频领域的正式进军。此次更新聚焦两大核心功能:原生支持9:16竖屏格式,专为移动端平台优化;新增4K分辨...
OpenAI投的机器人公司,发世界模型,靠“想象”干活儿
1X公司近日发布了名为1X World Model(1XWM)的世界模型,旨在提升其人形机器人Neo的通识行为能力和物理世界理解力。这一模型通过文字指令和初始画面生成未来...
上科大何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」
多模态模型在感知、理解与生成等方面的能力持续提升,但其输出中仍普遍存在与客观事实不一致的内容,即多模态幻觉现象。当模型面对信息缺失、语义含混或视觉...
不得了,这个新技术把视频压缩到了0.02%!
中国电信人工智能研究院(TeleAI)开发的生成式视频压缩技术(GVC)实现了革命性突破,将1GB视频压缩至仅需传输200K数据,压缩率达0.02%,同时保持画面高清连...
Manus走了,原生Agent登场:“AI助手”的第三次重新定义
过去十几年间,AI助手的发展经历了三次关键的预期校准阶段。从Siri的语音交互新鲜感,到ChatGPT的对话智能,再到Manus展现的主动执行能力,每一次突破都重新...
五源、陆奇投资,Humanify 97 年创始人专访:给 AI 做一套「有情商」的认知 OS
Humanify(人格智能)近日宣布完成数千万元种子轮融资,由五源资本领投,奇绩创坛跟投。这家成立于2024年的公司定位为模型与操作系统结合的基础设施提供商,...
王小川手里还握着冰冷的30亿
2026年1月13日,百川智能召开媒体沟通会,创始人王小川首次公开回应公司战略转型与医疗大模型的技术进展。他认为行业已到“爆发”节点,百川需要“重新建立连接”...
Claude自己写出Claude!2小时干完两月活,人类在工位上多余了?
Claude Cowork的发布标志着AI技术进入新阶段,其核心突破在于实现了完全由AI自主开发的端到端闭环系统。这款由Anthropic推出的办公工具仅用10天便完成开发,...
继宇树后,唯一获得三家大厂押注的自变量:具身模型不是把DeepSeek塞进机器人
国内具身智能领域正迎来以'大脑'为核心的新竞争阶段。自变量机器人近期完成10亿元融资,其核心突破在于对机器人'大脑'的重新定义——不同于依赖语言或多模态模...
边看边创造,在 PixVerse R1 的实时世界模型里,你真是上帝
爱诗科技发布的PixVerse R1被定位为'全球首个通用实时世界模型',其核心突破在于彻底改变了视频生成的交互范式。传统视频生成是单向的指令-等待-输出流程,而...




