大模型
LLM,VLM,模型
华为盘古大模型开源,推理方案、基础代码全公开!
华为今日宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型以及基于昇腾的模型推理技术。这一举措被视为华为推进昇腾生态战略的关键步骤...
百度文心大模型4.5系列正式开源,同步开放API服务
百度近日宣布文心大模型4.5系列正式开源,并同步提供API服务。此次开源共推出10款模型,涵盖从47B参数的混合专家(MoE)模型到轻量级0.3B稠密型模型,覆盖文...
“港股AGI第一股”来了!云知声今早登陆港交所上市,最新市值146亿港元
云知声智能科技股份有限公司于6月30日正式在港交所主板挂牌上市,股票代码9678.HK,成为“港股AGI第一股”。公司定价为205港元/股,开盘后微涨0.1%,截至发稿时...
媲美DeepSeek!腾讯开源新版混元模型:AI Agent强化,超30种智能体指令
腾讯最新开源的混元大模型Hunyuan-A13B,是一个拥有800亿参数的专家混合模型,其中130亿参数处于激活状态。该模型支持快速和慢速两种思考模式,分别适用于简...
硅谷大厂“杀疯了”!华人AI大牛被疯狂挖角,黄仁勋买下清华“天才少年”公司
全球AI竞争进入白热化阶段,硅谷科技巨头正通过高薪挖角顶尖人才和战略性收购来巩固领先地位。英伟达创始人黄仁勋近期亲自招募两位清华校友——华盛顿大学助理...
盘一盘,2017年Transformer之后,LLM领域的重要论文
Andrej Karpathy 的最新演讲提出了「软件 3.0」的概念,强调自然语言正在成为新的编程接口,而 AI 模型负责执行具体任务。这一变革不仅影响开发者,还深刻改...
华为CloudMatrix重磅论文披露AI数据中心新范式,推理效率超NV H100
AI大厂在GPU采购上的投入持续加码,但单纯堆砌硬件已无法满足高效算力需求。马斯克的xAI计划将10万卡超算规模扩大10倍,Meta则投资100亿美元建设130万卡数据...
Gary Marcus惊世之言:纯LLM上构建AGI彻底没了希望!MIT、芝大、哈佛论文火了
著名人工智能学者Gary Marcus转推了一篇由MIT、芝加哥大学和哈佛大学合著的论文,该论文揭示了大型语言模型(LLM)在推理和理解上存在的一种被称为“波将金式”...
独家揭秘OpenAI核心文件:AGI五级突破实锤!微软130亿投资或打水漂
AGI条款成为微软与OpenAI之间谈判的核心争议点,双方围绕技术授权和定义权展开了激烈的博弈。OpenAI联合创始人Ilya Sutskever曾预言,AI将彻底变革医疗体系,...
强化学习也能预训练?效果可提升20倍,华人新作引爆RL新范式!
大规模预训练和微调的模式在机器学习领域取得了显著成功,但在强化学习(RL)中的应用仍面临挑战。强化学习需要对时间和意图进行推理,传统方法在处理长时间...





