大模型
LLM,VLM,模型
DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路
GRPO训练作为一种基于PPO算法的改进方法,近年来在强化学习领域引起了广泛关注。GRPO通过采样替代value model的方式,简化了训练过程,提升了稳定性和可维护...
马斯克「大闹白宫」!美政府12000人将被GSAi优化,xAI 100万块GPU巨兽年底建成
马斯克领导的政府效率部(DOGE)正在加速开发一款名为GSAi的定制生成式AI应用,旨在提升美国总务管理局(GSA)约12,000名员工的日常工作效率。这一计划是特朗...
Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用
Anthropic最近发布了其最新的AI模型Claude 3.7 Sonnet,该模型在推理能力上表现出色,甚至在某些情况下展现出令人惊讶的决策能力。为了展示其强大的推理能力...
招生信息 | 香港大学刘希慧组计算机视觉方向博士招生,等你加入!
香港大学创立于1911年,是香港的首间大学,位于香港岛西部,2025年QS全球大学排名第17位。作为一所面向国际的综合性大学,香港大学为学生提供了扎实的学术研...
精度效率双冠王!时序预测新范式TimeDistill:跨架构知识蒸馏,全面超越SOTA
时序预测领域面临的核心挑战在于如何在保证预测精度的同时降低计算成本。传统的复杂模型如Transformer和CNN虽然在精度上表现优异,但计算开销较大,难以满足...
GDC 2025全球开发者大会回顾:算法与算力的双重革新
全球开发者大会(GDC)2025年在上海召开,聚焦人工智能技术的最新突破,围绕算法与算力两大核心议题展开深入探讨。大会吸引了全球顶尖的开发者、技术专家和产...
Manus引爆智能体复现潮!DeepSeek已被整合,项目挤满开源榜,海外大V排队求码
Manus的发布引发了智能体领域的广泛关注,带动了开源复现和商业闭源产品的快速发展。目前,两个开源项目——OpenManus和OWL——在Manus发布当天就推出了复现代码...
在大模型上没啥动静的美团,正在用另一种方式开抢AI的船票
中国互联网公司正经历资产重估,科技成为推动这一变化的核心动力。美团作为其中的代表,正在其第二个十年中加大对科技的关注。公司创始人兼CEO王兴在内部沟通...
阿里开源新模型:媲美DeepSeek-R1,参数大降20倍!
阿里巴巴近日开源了其最新的大模型QwQ-32B,该模型支持Apache 2.0开源协议,允许商业化使用。QwQ-32B在多个主流测试基准中表现优异,能够与DeepSeek的R1-671B...
通俗易懂说清楚什么是MCP
MCP 是一种由 Anthropic 公司推出的开放标准协议,旨在统一大型语言模型(LLM)与外部数据源和工具之间的通信。与 HTTP 或 TCP 类似,MCP 充当 AI 助手与数字...






