大模型

腾讯开源 HunyuanOCR，用纯粹视觉语言模型架构，仅1B参数刷新多项高阶任务SOTA

腾讯HunyuanOCR通过创新的端到端视觉语言模型架构，仅用10亿参数便解决了传统OCR系统的级联误差与通用大模型效率低下的双重难题。该系统摒弃了传统多模块串联...

AIGC动态

3个月前

夸克浏览器近日完成全面升级，深度融合阿里千问AI助手，推出具备操作系统级全局唤起能力的新一代AI浏览器。此次升级的核心在于将AI能力深度嵌入浏览器，用户...

AI-Agent

3个月前

在LLM优化领域，传统方法如Adam和新兴方法Muon各有优劣。Adam凭借动量和自适应学习率成为深度学习的主流选择，但在处理十亿级参数的混合精度训练时存在数值不...

AIGC动态

3个月前

2025年AI编程领域正经历从技术演示向生产级应用的关键转型。当前市场宣传多聚焦于生成简单Demo的能力，但实际开发中80%的价值来自对既有工程的迭代优化。专业...

AI-Agent

3个月前

中国科技企业腾讯近期在3D生成领域取得显著进展，其混元3D创作引擎国际版正式发布，API同步上线腾讯云国际站。与此同时，开源版混元3D的全球下载量突破300万...

AIGC动态

3个月前

Hugging Face的TRL库与RapidFire AI的集成标志着大模型开发进入超并行时代。单张GPU可同时运行多个微调实验，实验验证速度提升16至24倍，显著降低算力门槛。...

AI-Agent

4个月前

大模型与智能体的崛起正在重塑生产力的底层逻辑，推动个体工作效率和组织协作模式的深度变革。多位行业专家在AICon全球人工智能开发与应用大会的讨论中，揭示...

AIGC动态

4个月前

Anthropic最新发布的Claude Opus 4.5在多项关键性能指标上实现突破，成为当前AI领域的领跑者。该模型在编码、Agent能力和计算机操作等硬核测试中全面超越GPT-...

AI-Agent

4个月前

2025年，AIGC技术持续升温，AI生成内容已广泛应用于社交头像、电商海报和影视分镜等领域。通用图像编辑大模型如Nano Banana和Qwen Edit展现出强大的功能，覆...

AIGC动态

4个月前

在AI技术快速发展的背景下，为多个AI工具支付高昂订阅费用已成为开发者的负担。然而，许多平台提供了永久免费或开源解决方案，能够构建完整的AI编程技术栈。...

AIGC动态

4个月前