视频生成
视频,video
Agent 元年已至,我们会拥有自己的智能助理吗?|GAIR Live 预告
智能体技术的快速发展正在深刻改变我们的工作与生活方式,2024年被广泛认为是“Agent元年”。从AutoGPT到Devin,再到MCP、A2A和ANP,智能体技术正逐步渗透到各...
对话智源王仲远:机器人的大小脑可能会“合体”,但不是今天
在2024年智源大会上,智源研究院发布了'悟界'系列大模型,标志着人工智能技术向物理世界探索的显著进展。原生多模态世界模型Emu3通过统一架构实现了文本、图...
字节 AI 卷出新高度:豆包试水“上下文定价”,Trae 覆盖内部80%工程师,战略瞄定三主线
字节跳动近期分享了其对AI技术发展的思考,主要集中在三个关键领域。多模态推理和思考能力被视为模型能力爆发的关键,但目前行业尚未实现基于图片、视频等多...
一手评测Seedance 1.0 pro,字节首次登顶视频大模型竞技场的大杀器来了。
在火山引擎发布会上,展示了多项前沿技术,包括豆包大模型1.6、豆包视频生成模型Seedance 1.0 pro、语音播客模型以及端到端语音模型等。其中,Seedance 1.0 p...
WaveSpeedAI 成泽毅:AI Infra 本来就是一门能挣钱的生意
成泽毅的职业轨迹始于阿里,凭借出色的技术能力迅速晋升为部门骨干,但很快感受到大厂的天花板限制。追求更大发挥空间的他,先后加入两家推理加速初创公司,...
大模型是「躲在洞穴里」观察世界? 强化学习大佬「吹哨」提醒LLM致命缺点
加州大学伯克利分校副教授Sergey Levine近期提出一个核心疑问:为何语言模型通过预测下一个token能获得强大认知能力,而视频模型通过下一帧预测却收效甚微。...
一块4090搞定实时视频生成!Adobe黑科技来了
近年来,视频合成技术取得了显著进展,但实时生成高质量视频仍然面临挑战。基于双向注意力机制的扩散 Transformer(DiT)能够生成复杂的时序动态内容,但其非...
苹果WWDC2025:时隔十三年的新「UI」,以及更低调但随处可见的「AI」
北京时间2025年6月10日,苹果在WWDC25主题演讲中展示了其全系操作系统的重大更新,核心围绕「有史以来最大规模的视觉革新」展开。全新的「流光玻璃」设计语言...
2亿营收背后:“抛货”出海痛点如何被解码为效率革命
物流成本高企一直是纸巾出海行业的主要痛点,纸品作为典型的“抛货”,体积大但重量轻,导致运输成本居高不下,成为侵蚀利润空间的显著挑战。然而,植护作为国...
Meta正与Scale AI洽谈100亿美元投资
Meta正在与Scale AI洽谈一项超过100亿美元的投资,这将是Meta有史以来最大的一笔外部人工智能投资,也是私人公司有史以来最大的融资事件之一。Scale AI成立于...



