大模型
LLM,VLM,模型
媲美DeepSeek!腾讯开源新版混元模型:AI Agent强化,超30种智能体指令
腾讯最新开源的混元大模型Hunyuan-A13B,是一个拥有800亿参数的专家混合模型,其中130亿参数处于激活状态。该模型支持快速和慢速两种思考模式,分别适用于简...
硅谷大厂“杀疯了”!华人AI大牛被疯狂挖角,黄仁勋买下清华“天才少年”公司
全球AI竞争进入白热化阶段,硅谷科技巨头正通过高薪挖角顶尖人才和战略性收购来巩固领先地位。英伟达创始人黄仁勋近期亲自招募两位清华校友——华盛顿大学助理...
盘一盘,2017年Transformer之后,LLM领域的重要论文
Andrej Karpathy 的最新演讲提出了「软件 3.0」的概念,强调自然语言正在成为新的编程接口,而 AI 模型负责执行具体任务。这一变革不仅影响开发者,还深刻改...
华为CloudMatrix重磅论文披露AI数据中心新范式,推理效率超NV H100
AI大厂在GPU采购上的投入持续加码,但单纯堆砌硬件已无法满足高效算力需求。马斯克的xAI计划将10万卡超算规模扩大10倍,Meta则投资100亿美元建设130万卡数据...
Gary Marcus惊世之言:纯LLM上构建AGI彻底没了希望!MIT、芝大、哈佛论文火了
著名人工智能学者Gary Marcus转推了一篇由MIT、芝加哥大学和哈佛大学合著的论文,该论文揭示了大型语言模型(LLM)在推理和理解上存在的一种被称为“波将金式”...
独家揭秘OpenAI核心文件:AGI五级突破实锤!微软130亿投资或打水漂
AGI条款成为微软与OpenAI之间谈判的核心争议点,双方围绕技术授权和定义权展开了激烈的博弈。OpenAI联合创始人Ilya Sutskever曾预言,AI将彻底变革医疗体系,...
强化学习也能预训练?效果可提升20倍,华人新作引爆RL新范式!
大规模预训练和微调的模式在机器学习领域取得了显著成功,但在强化学习(RL)中的应用仍面临挑战。强化学习需要对时间和意图进行推理,传统方法在处理长时间...
2025,10000个Vibe Coding井喷
2025年标志着AI编程技术的爆发式发展,“AI Coding元年”的概念被广泛认可。各类创新工具正彻底改变传统编程模式,从简单的代码补全进化到能自主理解需求、规划...
OpenAI转向谷歌TPU:宿敌也能变朋友?
OpenAI近期开始租用谷歌的AI芯片以支持其产品,包括ChatGPT。这一举措标志着OpenAI首次真正使用非英伟达芯片,可能推动谷歌的TPU成为英伟达GPU的更便宜替代品...
小扎千亿挖人名单下一位:硅谷华人AI高管第一人
扎克伯格亲自带队,Meta正在积极招募AI人才,包括曾经从Meta被挖走的员工。这一举措反映了Meta在AI领域的紧迫需求和对人才的重视。扎克伯格不仅从竞争对手如O...