视频生成
视频,video
北大开源统一世界模型框架:多类合成推理任务一套搞定
在架构设计上,系统以Pipeline模块为核心调度中枢,统筹管理单轮推理与多轮交互流程。底层采用模型抽象规范,配合Operator模块完成多模态原始信号的校验与标...
视频生成从”能生成”到”能卖钱”,差的是什么?
为弥合技术与市场的鸿沟,前沿研发机构已将产品规划重心转移至真实应用场景。在广告投放领域,引入参考生视频机制可实现商品外观、材质细节及复杂运镜的高保...
实测纳逗 Pro:能做专业影视级内容的智能平台长啥样
当前人工智能视频技术已跨越早期功能验证阶段,全面进入追求画面质感、叙事逻辑与商业可用性深度融合的专业化发展新周期。行业竞争焦点逐步转向能否将生成式...
CVPR 2026 动态视觉智能观察梳理:Benchmark 之外的新考题已经出现
计算机视觉领域的研究重心正从单一基准测试的高精度优化,转向复杂开放环境下的持续理解与自适应。传统视觉系统长期依赖输入充分、目标预设及模型参数冻结的...
寻找 8 支 AI Native 硬件团队,好产品应该被更多人看见
随着多模态感知与主动决策能力的加速普及,当前终端生态正经历从指令执行向情境自主感知的范式跃迁,人工智能设备产业已进入规模化突破的关键周期,设备交互...
MiniCPM-o 4.5 技术报告发布:全双工全模态 API 开放,RTX5070 即可实时运行
面壁智能联合清华大学开源九亿参数模型,成功构建业界首个支持端到端全双工全模态交互的智能系统。该系统突破传统轮次对话的时序割裂,依托首创的Omni-Flow流...
CVPR 2026 生成式 AI 观察梳理:视觉模型开始重写默认设定
视觉人工智能领域的技术发展正经历从既定范式内性能堆叠向底层建模范式重构的关键转折。过去依赖的模型扩容与采样微调策略虽能短暂推升基准指标,但当前前沿...
刚刚,国产AI双冠王!黑马世界模型打破全球纪录,一镜到底封神
生数科技发布的世界行动模型MotuBrain在WorldArena与RoboTwin2.0两项国际权威评测中同步位列第一,成功打通环境感知与物理执行的底层数据链路。该架构彻底突...
生数科技认领神秘登顶模型:AI视频公司拿出工业级Demo,跨本体跑通复杂长程任务
实地运行验证表明,该系统无需依赖顶层视觉解析模型或预设控制脚本,即可直接驱动多款异构机械硬件完成复杂操作。演示环节覆盖空间整理、食材处理与双手机械...
阿里HappyHorse开启灰测,720P视频生成低至0.44元/秒
阿里巴巴视频生成模型已正式开启灰度测试,面向多元用户群体构建分级服务矩阵。专业机构与企业客户可依托独立官网及阿里云生态完成服务部署,大众用户则通过...





