标签:开源
视频可以精准控制了!一句话给熊戴眼镜的那种,扩散模型立功,浙大悉尼科技大学出品 | ICLR 2025
随着视频生成技术的快速发展,视频编辑作为其中的一个重要方向,逐渐成为研究热点。然而,传统的视频编辑方法通常局限于风格转换或单一目标的编辑,难以满足...
李开复:超大模型预训练逐渐寡头化,国内将收敛至 DeepSeek、阿里、字节三家
在彭博社的专访中,零一万物 CEO 李开复博士深入探讨了中国大模型行业的发展现状与未来趋势。他指出,DeepSeek 的爆红出圈为中国大模型行业完成了实质意义上...
01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员
字节跳动与清华大学AIR联合实验室SIA Lab近期推出了一种名为DAPO的强化学习(RL)算法,该算法在AIME 2024基准测试中表现优异,超越了DeepSeek的GRPO算法。DA...
英伟达开源通用机器人大模型—GR00T N1
全球AI领导者英伟达在“GTC 2025”开发者大会上宣布开源人形机器人通用大模型GR00T N1,该模型能够处理多模态数据,包括语言、图像和视频,适用于家务、工厂等...
比DeepSeek、o1高3倍!首创无服务器强化微调,只需十几个数据点,
知名大模型训练与开发平台Predibase发布了首个端到端强化微调平台(RFT),这一平台通过奖励函数和自定义函数实现持续强化学习,无需依赖大量标注数据。与传...
多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代
昆仑万维近期发布了Skywork R1V系列模型,这一多模态思维链推理模型在视觉推理和通用推理能力上达到了SOTA级别,成为国内首家开源多模态思维链推理模型的企业...
单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香
法国AI创企Mistral AI最近开源了一款名为Mistral Small 3.1的多模态小模型,该模型在多个基准测试中表现优异,超越了Gemma 3和GPT-4o Mini等同类模型。Mistra...
全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开
昆仑万维近日发布了全球首个开源的多模态推理大模型Skywork R1V(简称R1V),该模型拥有38B参数,性能直逼DeepSeek-R1,并在多项基准测试中取得了领先的成绩...
李开复:零一万物万智要企业大模型“最后一公里”,确认不再做超大基模迭代 | 钛媒体AGI
零一万物,由李开复创立的AI独角兽,宣布推出万智企业大模型一站式平台,旨在为企业提供定制化的DeepSeek部署解决方案。该平台预装高性能GPU,内置DeepSeek全...
CVPR 2025:无需物理引擎,一个模型搞定图像渲染与分解
在计算机图形和视觉领域,渲染与逆渲染是两个核心任务,分别涉及从3D模型生成2D图像和从2D图像解析3D属性。传统方法通常需要独立建模渲染器和逆渲染器,导致...




