标签:工程实践

大模型开发者必读!拆解世界级AI模型的诞生,Hugging Face把4年模型训练经验写成了一本开源指南

Hugging Face发布的《The Smol Training Playbook》手册,由12位顶尖工程师团队撰写,系统总结了构建世界级大语言模型的核心方法论。手册开篇便颠覆性地指出...

对 MCP 的批判性审视

MCP(模型上下文协议)旨在为大型语言模型(LLM)提供标准化的上下文交互接口,类比为AI应用的“USB-C端口”。该协议由Anthropic推动,试图统一LLM与外部数据源...

「还是谷歌好」,离职创业一年,我才发现训练大模型有这么多坑

机器之心报道了Yi Tay离开谷歌后创办Reka公司的经历,以及他在构建和训练大型语言模型(LLM)过程中遇到的挑战。Yi Tay分享了从零开始创建一家公司、筹集资金...