推理 | 第 2 页 | 学习AIGC

MoE那么大，几段代码就能稳稳推理 | 开源

华为最新开源项目Omni-Infer为超大规模混合专家网络模型（MoE）的推理提供了全面的架构、技术和代码支持。该项目旨在帮助企业用户实现高性能、易维护的推理部...

AIGC动态

9个月前

超越微软，全球第一！上交AI智能体炼成「Kaggle特级大师」，登顶OpenAI MLE-bench

上海交通大学人工智能学院Agents团队提出的AI专家智能体「ML-Master」在OpenAI发布的权威基准测试MLE-bench中取得了显著成绩，以29.3%的平均奖牌率位居榜首，...

AI-Agent

9个月前

只用2700万参数，这个推理模型超越了DeepSeek和Claude

大语言模型在复杂推理任务中面临任务分解复杂、数据需求大以及高延迟等问题，当前的思维链（CoT）技术存在局限性。为了解决这些问题，Sapient Intelligence的...

AIGC动态

9个月前

文心大模型 4.5 系列正式开源，涵盖 10 余款模型

百度于6月30日正式开源了文心大模型4.5系列，涵盖10款不同参数规模的模型，包括47B、3B激活参数的混合专家（MoE）模型和0.3B参数的稠密型模型。这些模型已在...

AIGC动态

9个月前

华为盘古大模型开源，推理方案、基础代码全公开！

华为今日宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型以及基于昇腾的模型推理技术。这一举措被视为华为推进昇腾生态战略的关键步骤...

AIGC动态

9个月前

媲美DeepSeek！腾讯开源新版混元模型：AI Agent强化，超30种智能体指令

腾讯最新开源的混元大模型Hunyuan-A13B，是一个拥有800亿参数的专家混合模型，其中130亿参数处于激活状态。该模型支持快速和慢速两种思考模式，分别适用于简...

AI-Agent

9个月前

Gary Marcus惊世之言：纯LLM上构建AGI彻底没了希望！MIT、芝大、哈佛论文火了

著名人工智能学者Gary Marcus转推了一篇由MIT、芝加哥大学和哈佛大学合著的论文，该论文揭示了大型语言模型（LLM）在推理和理解上存在的一种被称为“波将金式”...

AIGC动态

9个月前

AI Infra 工程师们如何应对大模型流水线里的“暗涌”？

在大模型基础设施（Infra）领域，工程师们面临着诸多挑战和需求，尤其是在训练和推理环节的稳定性、性能优化以及资源调度方面。并行策略兼容性、工程流水线管...

AIGC动态

9个月前

OpenAI底层AGI技术被曝光！前研究主管豪言：从此再无新范式

OpenAI前研究主管Bob McGrew公开表示，AGI的「技术拼图」已经齐全，关键在于如何将推理能力落地并重塑价值创造路径。他认为，实现通用人工智能（AGI）的三大...

AIGC动态

9个月前

田渊栋：连续思维链效率更高，可同时编码多个路径，“叠加态”式并行搜索

田渊栋团队的最新研究揭示了AI模型在处理复杂任务时，通过连续思维链的并行搜索机制，能够显著提升推理效率。传统的大语言模型（LLM）通常采用离散思维链进行...

AIGC动态

9个月前

标签：推理

MoE那么大，几段代码就能稳稳推理 | 开源

超越微软，全球第一！上交AI智能体炼成「Kaggle特级大师」，登顶OpenAI MLE-bench

只用2700万参数，这个推理模型超越了DeepSeek和Claude

文心大模型 4.5 系列正式开源，涵盖 10 余款模型

华为盘古大模型开源，推理方案、基础代码全公开！

媲美DeepSeek！腾讯开源新版混元模型：AI Agent强化，超30种智能体指令

Gary Marcus惊世之言：纯LLM上构建AGI彻底没了希望！MIT、芝大、哈佛论文火了

AI Infra 工程师们如何应对大模型流水线里的“暗涌”？

OpenAI底层AGI技术被曝光！前研究主管豪言：从此再无新范式

田渊栋：连续思维链效率更高，可同时编码多个路径，“叠加态”式并行搜索

热门网址

标签：推理

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址