图像生成
图像,绘画
2秒终结AI 3D不可能三角,我们和VAST首席科学家曹炎培聊了聊
VAST发布的Tripo P1.0模型实现了AI 3D生成领域的关键突破,首次在原生三维空间中完成概率化生成,将生成时间压缩至约2秒,输出模型达到专业建模师水准,面数...
AI的七窍打通了!谷歌发布Gemini Embedding 2原生多模态嵌入模型
谷歌正式发布了名为 Gemini Embedding 2 的新型基础架构,实现了 AI 像人类一样用五种感官同步感知世界。这个系统将文字、图像、视频、音频和文档数据全部整...
谷歌AGI底座降临!首个原生全模态嵌入模型上线,已实现全模态SOTA
谷歌正式发布了首个原生全模态 Embedding 模型 Gemini Embedding 2,该模型能够将文本、图像、音视频及 PDF 文档无损融合于统一向量空间。这一突破性进展实现...
腾讯混元团队最新研究:让 AI 从「固定模型」走向「实时适配系统」
传统机器学习系统通常假设模型训练完成后参数固定,但这在处理多样性和冲突性任务时存在局限。腾讯混元团队提出的 HY-WU 方法改变了这一范式,让模型在推理阶...
让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间
谷歌发布了首款原生多模态嵌入模型 Gemini Embedding 2。该模型的核心突破在于将文本、图像、视频、音频及文档等多种数据类型映射至同一个统一的嵌入空间。不...
Gemini 账户 48 小时被盗刷 57 万,三人创业团队站在破产边缘
一家仅3名开发者的墨西哥小型初创公司,正常每月谷歌云服务支出约180美元,其Gemini账户API密钥被盗用后,48小时内产生82314.44美元(约合人民币57万元)的账...
OpenAI 黑客松冠军、英伟达 CES 幕后,都在用同一个 3D 工具
Varick Lim赢得OpenAI第一届Codex黑客松冠军时,仅用一部iPhone就完成了StoryWorld项目演示,输入提示词即可几秒内在真实空间生成完整可调度的3D场景,该项目...
龙虾最大痛点被官方插件升级!对话永不忘记,GPT和Gemini最强模型都可接入
OpenClaw推出2026.3.7测试版,已上线GPT-5.4和Gemini Flash 3.1两款最新模型,同步更新了多项功能,本次更新整体可归纳为三个方向:上下文管理插件化、Agent...
模型大脑可实时更新!用文本一键重塑模型记忆,低延迟按需即时更新
当前大型语言模型在长效记忆和持续适配方面存在核心发展瓶颈,缺乏长效记忆会引发交互摩擦与信息断层,增加系统响应时间,缺乏持续适配能力则会让模型无法从...
14B规模竟也能单卡实时生成视频?多亏这个强大的开源底座
春节期间Seedance 2.0爆火推动视频生成领域关注度提升,字节跳动联合北大、安努智能、Canva开源具备实时生成能力的Helios视频模型家族,包含三个版本,全面覆...



