标签:工程优化

梁文锋DeepSeek新论文!接棒何恺明和字节,又稳了稳AI的“地基”

DeepSeek在2026年初发布了一篇关于mHC(流形约束超连接)的论文,这项研究对Transformer架构中最基础的残差连接(Residual Connection)进行了重要改进。残差...

写在 Manus“卖身”后:企业级 Agent 只会更像软件,而非魔法

Meta近日宣布全资收购生成式AI公司Manus,交易金额达数十亿美元,成为该公司历史上第三大收购案。Manus创始人肖弘将出任Meta副总裁,团队整体并入Meta AI部门...

腾讯按下AI加速键,人才、组织、开源动作密集

腾讯在2025年尾声加速AI领域布局,通过人才引进、组织架构调整和技术迭代释放明确信号。前OpenAI研究员姚顺雨加入腾讯,出任首席AI科学家,直接向总裁汇报,...

实测万相2.1,全球首个中文文字生成开源模型,吊打Sora了?

2月25日,阿里推出的万相2.1视频生成模型正式开源,包含14B和1.3B两个参数版本,支持文生视频、图生视频任务,并采用Apache2.0协议允许商业使用。在VBench评...

杨植麟和梁文锋,论文撞车了

在马斯克发布Grok3的同一天,DeepSeek与月之暗面分别发布论文,针对Transformer架构的核心注意力机制提出创新方案。DeepSeek的原生稀疏注意力(NSA)通过语义...