图像生成

手机跑多模态也能快到飞起！面壁MiniCPM-V 4.6开源

大模型技术正加速向移动终端演进，实现复杂图文与视频任务的本地化实时处理。MiniCPM-V 4.6作为一款专为端侧部署深度优化的多模态模型，依托视觉编码器与轻量...

AIGC动态

3周前

字节商业化技术团队近期提出全新视觉生成架构生成精炼网络，为图像与视频自动化创作开辟出独立于主流扩散模型与自回归模型的第三种技术路线。该架构创新性采...

AIGC动态

3周前

面壁智能联合清华大学及开源社区正式发布了端侧多模态大模型MiniCPM-V 4.6，该模型仅具备约1.3B参数规模，却在多模态性能与运行效率上实现了对同级别主流模型...

AIGC动态

3周前

商汤推出的SenseNova U1系列模型基于自研的NEO-unify架构，彻底摒弃传统视觉编码器与变分自编码器，直接在像素与文本层面实现端到端协同学习。该设计突破了多...

AIGC动态

3周前

全球人工智能产业竞争格局正呈现显著变化，传统头部企业主导的市场迎来全新参与者。Agnes AI近期在多项国际权威测评中表现突出，正式位列全球实验室综合排名...

AIGC动态

4周前

Genesis AI发布的首个机器人基础模型GENE-26.5实现了以真实物理速度完成烹饪、移液、线束组装及乐器演奏等高复杂度任务的能力突破。测试过程中，模型能够自主...

AIGC动态

4周前

定量评估结果显示，在零三维语义标签注入条件下，该算法斩获59.50的几何交并比与21.05的语义均分，基础占据预测精度已超越传统闭集基线，且单卡推理帧率实现...

AIGC动态

4周前

面向未来家庭与服务机器人的空间交互需求，室内三维视觉感知面临场景高度动态、遮挡密集及预定义类别受限等挑战，传统方案通常依赖昂贵的逐体素语义标注。为...

AIGC动态

4周前

当前三维视觉研究正从单纯的图像重建生成，迈向深度的空间理解与物理动态模拟。视觉人工智能的核心目标已从二维表面感知转向对真实三维世界的建模与交互。研...

AIGC动态

4周前

全球人工智能产业正步入资本加速与底层技术攻坚并行的关键阶段。头部初创企业拟发起数百亿美元规模融资，计划通过巨额算力投入突破研发瓶颈并冲击行业估值新...

AIGC动态

4周前