大模型

DeepSeek同款GRPO训练大提速！魔搭开源全流程方案，支持多模态训练、训练加速和评测全链路

GRPO训练作为一种基于PPO算法的改进方法，近年来在强化学习领域引起了广泛关注。GRPO通过采样替代value model的方式，简化了训练过程，提升了稳定性和可维护...

AIGC动态

1年前 (2025)

马斯克领导的政府效率部（DOGE）正在加速开发一款名为GSAi的定制生成式AI应用，旨在提升美国总务管理局（GSA）约12,000名员工的日常工作效率。这一计划是特朗...

AIGC动态

1年前 (2025)

Anthropic最近发布了其最新的AI模型Claude 3.7 Sonnet，该模型在推理能力上表现出色，甚至在某些情况下展现出令人惊讶的决策能力。为了展示其强大的推理能力...

AIGC动态

1年前 (2025)

香港大学创立于1911年，是香港的首间大学，位于香港岛西部，2025年QS全球大学排名第17位。作为一所面向国际的综合性大学，香港大学为学生提供了扎实的学术研...

AIGC动态

1年前 (2025)

时序预测领域面临的核心挑战在于如何在保证预测精度的同时降低计算成本。传统的复杂模型如Transformer和CNN虽然在精度上表现优异，但计算开销较大，难以满足...

AIGC动态

1年前 (2025)

全球开发者大会（GDC）2025年在上海召开，聚焦人工智能技术的最新突破，围绕算法与算力两大核心议题展开深入探讨。大会吸引了全球顶尖的开发者、技术专家和产...

AIGC动态

1年前 (2025)

Manus的发布引发了智能体领域的广泛关注，带动了开源复现和商业闭源产品的快速发展。目前，两个开源项目——OpenManus和OWL——在Manus发布当天就推出了复现代码...

AIGC动态

1年前 (2025)

中国互联网公司正经历资产重估，科技成为推动这一变化的核心动力。美团作为其中的代表，正在其第二个十年中加大对科技的关注。公司创始人兼CEO王兴在内部沟通...

AIGC动态

1年前 (2025)

阿里巴巴近日开源了其最新的大模型QwQ-32B，该模型支持Apache 2.0开源协议，允许商业化使用。QwQ-32B在多个主流测试基准中表现优异，能够与DeepSeek的R1-671B...

AI-Agent

1年前 (2025)

MCP 是一种由 Anthropic 公司推出的开放标准协议，旨在统一大型语言模型（LLM）与外部数据源和工具之间的通信。与 HTTP 或 TCP 类似，MCP 充当 AI 助手与数字...

AIGC动态

1年前 (2025)