标签:算力优化
狂拿大模型明星订单,一家清华系HPC-AI Infra公司浮出水面
93年创始人闫博文带领的是石科技在高性能计算领域展现出独特的发展路径。这家从国家超级计算无锡中心孵化而来的企业,凭借深厚的技术积累,在不盲目囤积算力...
华为CloudMatrix重磅论文披露AI数据中心新范式,推理效率超NV H100
AI大厂在GPU采购上的投入持续加码,但单纯堆砌硬件已无法满足高效算力需求。马斯克的xAI计划将10万卡超算规模扩大10倍,Meta则投资100亿美元建设130万卡数据...
推荐大模型来了?OneRec论文解读:端到端训练如何同时吃掉效果与成本
推荐系统正经历由大型语言模型(LLM)驱动的范式变革。传统级联架构因算力碎片化、目标冲突等问题面临瓶颈,而快手提出的端到端生成式系统OneRec通过整合Enco...
华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群
华为首次推出了一项名为“数字化风洞”的技术,旨在通过虚拟环境平台在正式训练和推理复杂AI模型之前进行预演,从而优化资源配置并减少算力浪费。该技术由华为...
谷歌提出Titans:突破算力限制,扩展上下文
谷歌研究院推出的Titans框架通过创新架构设计突破了大语言模型的长上下文处理瓶颈,将模型上下文窗口扩展至200万token,同时仅增加1.8倍算力消耗。该框架在语...
Nature认证DeepSeek成科研工具全能者,国内高校如何借力大模型?
近年来,大模型在科研领域的应用深度显著提升,DeepSeek系列模型因其开源、低成本和高性能特点受到全球科研界关注。科学家们纷纷涌向DeepSeek,这种模型已成...
推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考
一种名为Huginn的新型开源推理大模型架构通过在连续高维潜空间中直接操作隐藏状态,突破了传统长思维链推理范式的限制。该模型由马克思普朗克研究所和马里兰...
OpenAI内部模型曝光!编程能力跻身全球Top50程序员,年底不再有人类对手
OpenAI首席执行官山姆·奥特曼在东京大学对话活动中披露了多项关键进展。内部推理模型已具备全球前50位程序员的编程能力水平,预计2023年底将超越人类顶尖程序...
不断有人在问,这个中国模型到底有什么魔力?
低成本、高性能的AI模型开发方法正在全球范围内掀起新一轮技术热潮。通过李飞飞团队的研究以及上海交大团队的工作可以看出,利用Qwen作为基座模型,结合创新...
对话蚂蚁技术研究院院长陈文光:AI的发展极大受到数据驱动,国产推理软件系统仍需追赶英伟达|钛媒体AGI
在2024年外滩大会的“从DATA for AI到AI for DATA”见解论坛上,清华大学计算机科学与技术系教授、蚂蚁集团副总裁兼蚂蚁技术研究院院长陈文光发表了关于科学发...
1
2