大模型
LLM,VLM,模型
刚拿下NeurIPS最佳论文,字节就开源VAR文生图版本,拿下SOTA击败扩散模型
字节跳动商业化技术团队开发了一款名为Infinity的自回归文生图新模型,该模型在图像生成质量上超越了扩散模型,并在推理速度上继承了VAR的速度优势。Infinity...
OpenAI再招华人研究员!高中入围美国“少年诺贝尔奖”,还在哈佛教书
哈佛华人研究员Jeffrey Wang宣布加入OpenAI,担任基础团队研究员,负责模型预训练和推理。此前,Wang在哈佛一边教课一边研究机器学习。他于2021年本科入学哈...
DeepSeek-V3:美国芯片封锁的“意外”产物?
中国团队DeepSeek在AI领域取得了显著成就,仅用600万美元和两个月时间,就训练出了一个6710亿参数的AI模型DeepSeek-V3,其训练效率是Meta训练Llama 3模型的11...
突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型
Meta公司近期发布了一项名为“记忆层”的创新研究,旨在解决预训练大模型中因参数增加而导致算力需求指数级增长的问题。记忆层通过高效查询机制,避免了遍历整...
大厂加码AI,阿里云与“大模型六虎”零一万物成立产业大模型联合实验室|钛媒体AGI
阿里云与零一万物达成战略合作,共同成立“产业大模型联合实验室”,旨在加速大模型技术从研发到产业应用的转化,并扩大产业大模型的生态整合。此次合作将结合...
2030年,中国将面临400万AI人才荒|钛媒体AGI
AI行业的人才竞争正在加剧,IBM原全球副总裁谢东博士加入北京电控旗下的AI国企北电数智,担任首席技术官,其丰富的产业经验和技术规划能力将助力公司在AI领域...
10秒极速出片!还有超多特效模版,国产视频模型又整新活了
2025年初,国产AI视频模型PixVerse发布了3.5版本,带来了一系列新功能和改进。新模型能在10秒内生成高清视频,处理复杂运动和多种二次元风格。内置模板丰富,...
全面打破GPT-4垄断、DeepSeek打下训练成本…2024年大模型领域进展全复盘
2024年是生成式人工智能(AI)取得显著进步的一年,特别是在大型语言模型(LLM)领域。英国独立研究员Simon Willison回顾了过去一年中的关键发展和主题。以下...
创新突破!字节跳动首创无需数据,1.58位超低量化自监督生成
字节跳动研究人员针对大型语言模型(LLM)在推理和生成过程中占用大量内存的问题,提出了一种创新的量化方法。该方法不依赖实际图像数据,仅利用模型自身的自...
斯坦福推出了一款AI工具,完全可以替代Google Research
斯坦福大学开发了一款名为STORM的论文写作辅助工具,该工具由LLM驱动,能够从数百个网站中搜集和检索相关信息,帮助用户从零开始生成一篇论文。STORM撰写的论...




