大模型

刚拿下NeurIPS最佳论文，字节就开源VAR文生图版本，拿下SOTA击败扩散模型

字节跳动商业化技术团队开发了一款名为Infinity的自回归文生图新模型，该模型在图像生成质量上超越了扩散模型，并在推理速度上继承了VAR的速度优势。Infinity...

AIGC动态

1年前 (2025)

哈佛华人研究员Jeffrey Wang宣布加入OpenAI，担任基础团队研究员，负责模型预训练和推理。此前，Wang在哈佛一边教课一边研究机器学习。他于2021年本科入学哈...

AIGC动态

1年前 (2025)

中国团队DeepSeek在AI领域取得了显著成就，仅用600万美元和两个月时间，就训练出了一个6710亿参数的AI模型DeepSeek-V3，其训练效率是Meta训练Llama 3模型的11...

AIGC动态

1年前 (2025)

Meta公司近期发布了一项名为“记忆层”的创新研究，旨在解决预训练大模型中因参数增加而导致算力需求指数级增长的问题。记忆层通过高效查询机制，避免了遍历整...

AIGC动态

1年前 (2025)

阿里云与零一万物达成战略合作，共同成立“产业大模型联合实验室”，旨在加速大模型技术从研发到产业应用的转化，并扩大产业大模型的生态整合。此次合作将结合...

AIGC动态

1年前 (2025)

AI行业的人才竞争正在加剧，IBM原全球副总裁谢东博士加入北京电控旗下的AI国企北电数智，担任首席技术官，其丰富的产业经验和技术规划能力将助力公司在AI领域...

AIGC动态

1年前 (2025)

2025年初，国产AI视频模型PixVerse发布了3.5版本，带来了一系列新功能和改进。新模型能在10秒内生成高清视频，处理复杂运动和多种二次元风格。内置模板丰富，...

AIGC动态

1年前 (2025)

2024年是生成式人工智能（AI）取得显著进步的一年，特别是在大型语言模型（LLM）领域。英国独立研究员Simon Willison回顾了过去一年中的关键发展和主题。以下...

AIGC动态

1年前 (2025)

字节跳动研究人员针对大型语言模型（LLM）在推理和生成过程中占用大量内存的问题，提出了一种创新的量化方法。该方法不依赖实际图像数据，仅利用模型自身的自...

AIGC动态

1年前 (2025)

斯坦福大学开发了一款名为STORM的论文写作辅助工具，该工具由LLM驱动，能够从数百个网站中搜集和检索相关信息，帮助用户从零开始生成一篇论文。STORM撰写的论...

AIGC动态

1年前 (2025)