大模型
LLM,VLM,模型
DeepDiver-V2来了,华为最新开源原生多智能体系统,“团战”深度研究效果惊人
华为发布的DeepDiver-V2原生多智能体系统采用“团队作战”模式,在复杂知识问答和深度研究报告生成方面表现出色,且已开源。性能优于同规格竞品:在BrowseComp-...
阿里云,这次杀疯了,断档第一
阿里云在 AI 云市场断层式领先,份额比第二名到第四名加起来还多。Omdia 的报告显示其数据客观,引发对 AI 云和阿里云优势的探讨。AI 云的发展演进:技术重点...
阿里DeepSeek时刻!开源新架构模型:推理快10倍、成本暴降90%
今天凌晨2点,阿里巴巴开源新架构模型Qwen3-Next-80B-A3B,引发广泛关注。Qwen3-Next是混合专家模型,总参数800亿,仅激活30亿,训练成本较Qwen3 - 32B暴降90...
央企怎么做超级智能体?对谈中电信天翼AI:自研模型为底座,自主规划是必须,能适应千行百业才行
中国电信天翼AI发布星辰超级智能体,获DBC德本咨询2025企业级AI Agent榜单央企第一。此次访谈中国电信人工智能研究院副院长李永翔和中电信人工智能科技(北京...
SimpleTIR:让大模型“边写代码边思考”不再崩溃
多轮 RL 训练大模型进行工具调用时,常出现训练崩溃问题,SimpleTIR 旨在解决这一难题。多轮训练崩溃的原因可归结为“分布偏移 + 低概率 token 的链式雪崩”。...
宇树王兴兴:我最后悔的是过去没学AI技术,机器人数据和模型都是核心问题
9月11日,在2025 Inclusion外滩大会的圆桌讨论上,宇树科技创始人、CEO王兴兴分享创业经历,探讨大模型时代机器人产业发展。王兴兴从小对机器人感兴趣,后悔2...
字节跳动发布OmniHuman-1.5,数字人界的“影帝”诞生了
想象与能“眉来眼去”、进行情绪交流的AI虚拟人聊天并非科幻,字节跳动智能创作实验室推出的OmniHuman - 1.5宣告“数字人新王”登基。此前市面上的AI数字人多是“...
英伟达的AI已经开始接管整个项目了?SATLUTION自主进化代码库登顶SAT竞赛
AI在软件开发领域的应用取得了重要进展,NVIDIA Research的研究人员提出的SATLUTION框架,将LLM代码进化能力从“算法内核”扩展到“完整代码库”规模,在布尔可满...
Seedream 4.0 来了,AI 图片创业的新机会也来了
今年AI生图领域爆款频出,先是GPT - 4o生成的吉卜力风格图像走红,后有Google旗下的Nano Banana模型因手办照片受到关注。不过,Nano Banana中文支持欠佳,而...
刚刚,Thinking Machines Lab首次发长文,揭开LLM推理不确定性真相
人工智能初创公司 Thinking Machines Lab 发布文章《克服 LLM 推理中的不确定性》,探讨大语言模型推理不确定性的原因及解决方法。可复现性是科学进步的基石...