大模型

LLM,VLM,模型

多人会话视频生成新突破:香港科技大学,浙江大学用单人数据实现多人交互视频生成

AnyTalker框架通过创新的音频-人脸交叉注意力机制(AFCA)和两阶段训练策略,实现了高质量、可扩展的多人对话视频生成。该技术由香港科技大学、浙江大学等机...

Transformers来到了v5时代:从工具包到真理之源,AI时代的操作系统内核的极简进化论

Transformers v5的发布标志着AI基础设施演进的重要里程碑。该版本通过模块化重构、统一量化标准和端云生态整合,将碎片化的开发流程收敛为工业标准,日均安装...

Sora 2两月留存率接近0%,奥特曼得学抖音快手?

OpenAI推出的视频生成应用Sora 2曾被视为颠覆短视频行业的'核武器',但市场反馈却极为冰冷。硅谷风投机构a16z合伙人Olivia Moore披露的数据显示,Sora 2的30...

Google什么时候这么会做产品了?

NotebookLM作为Google旗下集成Gemini3和Nano Banana2技术的笔记产品,正在重新定义AI工具的生产力价值。用户无需掌握复杂提示词工程即可实现多模态内容生成,...

NTU S-Lab 团队探索可动 3D 新方向:结构、关节、纹理一次到位

南洋理工大学 S-Lab 团队提出的 ArtiLatent 框架实现了从单张图像生成具备精确几何结构、合理关节参数和自然外观纹理的可动三维模型。该研究通过统一的结构化...

全球最大云厂商,将「最牛马」的工作交给了 AI Agent

亚马逊云科技在2025年re:Invent大会上发布了一系列围绕AI Agent的重大更新,标志着其在Agent时代的云计算核心重构。这些更新分为两大方向:面向客户的Agent应...

豆包官宣手机助手:AI 还能带来哪些新体验?

字节跳动旗下豆包团队近期宣布推出豆包手机助手,标志着大模型技术向用户日常生活场景迈出关键一步。这一产品并非通过自研硬件实现,而是与中兴等手机厂商合...

夸克 AI 眼镜 S1 体验:超越 Meta 的决心,以及方法论

阿里巴巴旗下首款自研硬件夸克AI眼镜S1的发布,标志着互联网巨头正式进军智能穿戴领域。这款产品在双十一预售期间便成为销冠,其核心逻辑在于通过供应链「死...

原来这届中国AI年轻人,已经卷到业界都惊了

在小红书上,一场为期五个多月的广告算法大赛引发了技术爱好者们的热烈讨论和积极参与。这场由腾讯广告主办的竞赛以360万元奖金池为激励,聚焦于「全模态生成...

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer

历时四个月的腾讯广告算法大赛近日落下帷幕,这场汇聚全球30个国家、8400多名技术精英的「千团大战」最终由来自华中科技大学、北京大学和中国科学技术大学的...
1 143 144 145 146 147 906