大模型
LLM,VLM,模型
用短视频成本生成长视频,字节Seed新注意力机制让计算量降低85%
字节Seed与斯坦福等机构研究人员推出新模型,提出Mixture of Contexts(MoC)稀疏注意力机制,可将长视频生成的计算量降低85%,且能保持视频质量和连贯性。在...
美团新模型有点东西:像调度外卖运力一样优化大模型
美团最新发布的 LongCat - Flash 模型将外卖“派单逻辑”应用于 AI 世界,精准调度算力,试图在大模型赛道开辟新战场。技术创新方面,LongCat - Flash 的特别之...
冲上热搜!美团大模型,靠「快」火了
随着 AI 普及,模型厂商开始关注在保证准确性的前提下,如何以最少算力解决问题并快速给出回应,相关开源模型也逐渐增多。美团新开源的 LongCat - Flash - Ch...
一张卡片,不仅 AI 了我的工作,还摸清了我的八字和 MBTI?|AI 上新
AI硬件已成为大模型之后令人兴奋的领域,且逐渐分化到各个垂直领域。2025年8月25日,钉钉发布了与应用强绑定的AI硬件DingTalk A1,致力于成为「会议」和灵感...
美团新模型有点东西:像调度外卖小哥一样优化大模型
美团将外卖“派单逻辑”应用于AI世界,推出LongCat - Flash模型,精准调度算力,试图在大模型赛道开辟新战场。技术创新方面,LongCat - Flash的特别之处在于“精...
腾讯开源WMT2025冠军大模型:拿下30个第一,同类最佳
昨晚,腾讯开源了在2025年世界机器翻译大会(WMT2025)上表现优异的翻译大模型Hunyuan-MT-7B。该模型在31种主流和小众语言测试中,拿下30个语种第一,在权威...
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
美团发布的开源大模型Longcat-Flash-Chat引发海内外技术圈热议。该模型成绩亮眼,在部分benchmark上表现超过DeepSeek-V3.1、Qwen3 MoE - 2507等,编程能力也...
科普向:一文解构大模型后训练,GRPO和它的继任者们的前世今生
大语言模型的发展迅速,后训练的强化学习算法不断演进。从 PPO 到 GRPO 再到后续改进算法,都在不断提升模型性能与稳定性。后训练与强化学习的重要性:大语言...
Meta联手UCSD发布DeepConf:计算成本暴降85%,99.9%准确率!
在人工智能领域,Meta AI 联合加州大学圣地亚哥分校推出的“DeepConf”新技术,为解决 AI 高难度推理难题带来了新突破。该技术解决了让 AI 在高难度推理中保持...
那天,AI大模型想起了,被「失忆」所束缚的枷锁
大语言模型(LLM)的记忆能力是其进一步发展和广泛应用的关键。近期,谷歌、Anthropic、OpenAI、xAI 等公司纷纷为旗下的模型赋予记忆功能,字节跳动等也发布...





