大模型

LLM,VLM,模型

腾讯开源 HunyuanOCR,用纯粹视觉语言模型架构,仅1B参数刷新多项高阶任务SOTA

腾讯HunyuanOCR通过创新的端到端视觉语言模型架构,仅用10亿参数便解决了传统OCR系统的级联误差与通用大模型效率低下的双重难题。该系统摒弃了传统多模块串联...

抱歉了Chrome,这次我选中国这款AI浏览器

夸克浏览器近日完成全面升级,深度融合阿里千问AI助手,推出具备操作系统级全局唤起能力的新一代AI浏览器。此次升级的核心在于将AI能力深度嵌入浏览器,用户...

Adam的稳+Muon的快?华为诺亚开源ROOT破解大模型训练「既要又要」的两难困境

在LLM优化领域,传统方法如Adam和新兴方法Muon各有优劣。Adam凭借动量和自适应学习率成为深度学习的主流选择,但在处理十亿级参数的混合精度训练时存在数值不...

从代码补全到真实软件的生产级工具:Qoder 如何改写 AI 编程规则

2025年AI编程领域正经历从技术演示向生产级应用的关键转型。当前市场宣传多聚焦于生成简单Demo的能力,但实际开发中80%的价值来自对既有工程的迭代优化。专业...

从游戏工厂到空间智能仿真:混元 3D 为何是腾讯 AI 的“侧翼突围”

中国科技企业腾讯近期在3D生成领域取得显著进展,其混元3D创作引擎国际版正式发布,API同步上线腾讯云国际站。 与此同时,开源版混元3D的全球下载量突破300万...

单卡跑出集群效率!Hugging Face TRL 与 RapidFire AI 的超并行革命

Hugging Face的TRL库与RapidFire AI的集成标志着大模型开发进入超并行时代。单张GPU可同时运行多个微调实验,实验验证速度提升16至24倍,显著降低算力门槛。...

工作场景AI化,一个月花100美元订阅AI工具值吗?

大模型与智能体的崛起正在重塑生产力的底层逻辑,推动个体工作效率和组织协作模式的深度变革。多位行业专家在AICon全球人工智能开发与应用大会的讨论中,揭示...

Claude Opus 4.5夺回编程王座,超Gemini 3 Pro和GPT-5.1

Anthropic最新发布的Claude Opus 4.5在多项关键性能指标上实现突破,成为当前AI领域的领跑者。该模型在编码、Agent能力和计算机操作等硬核测试中全面超越GPT-...

与Banana Pro过过招,国产Libcom图像合成工作台开启Labubu漫游记

2025年,AIGC技术持续升温,AI生成内容已广泛应用于社交头像、电商海报和影视分镜等领域。通用图像编辑大模型如Nano Banana和Qwen Edit展现出强大的功能,覆...

99个最佳免费AI编程智能体与平台,2025年11月最新版

在AI技术快速发展的背景下,为多个AI工具支付高昂订阅费用已成为开发者的负担。然而,许多平台提供了永久免费或开源解决方案,能够构建完整的AI编程技术栈。...
1 92 93 94 95 96 845