文章摘要
大模型技术的崛起为新一代中国技术创业者提供了打破传统桎梏的机遇,使他们能够将技术理想与商业价值更紧密地结合。MiniMax创始人闫俊杰与罗永浩的对话揭示了这一转变的核心逻辑:当模型通用性突破临界点,技术追求与商业回报将不再是矛盾体,而是同一曲线的两面。闫俊杰的创业历程印证了这一点——从早期在商汤科技经历AI 1.0时代定制化模型的困境,到受CLIP论文启发创立MiniMax,其技术路径始终围绕「模型通用化」这一第一性原理展开。
在技术演进过程中,模型能力直接决定产品形态的规律被反复验证。Glow产品的用户流失事件表明,AI产品的核心价值并非来自运营技巧,而是底层技术能力的映射。这种认知促使MiniMax采取更激进的技术路线:当行业聚焦LLaMA复现时,其选择探索MoE架构;在全行业收缩战线时,仍坚持文本、语音、视觉三线并进的研发策略。这种「纯粹技术创业」的代价是四次预训练失败和单次1500万美元的算力损耗,但最终换来了架构创新的先发优势。
2025年DeepSeek R1的冲击成为行业分水岭。MiniMax通过三项关键突破重建信心:率先采用线性注意力架构、提出被Meta采用的CISPO算法,以及定义交错思维链的交互标准。技术自信源于全模态能力的补齐——语音模型国际领先、视频生成跻身第一梯队、音乐模型进入全球三强,最终文本模型通过M2版本获得开发者认可。闫俊杰将中美技术差距量化为「1/50投入实现95%效果」,这种效率优势支撑起其全球多模态竞争的战略定位。
商业环境与技术信仰的关系正在重构。过去技术理想常被视为需要掩饰的「羞耻」,而大模型时代的技术-商业正反馈循环打破了这种认知。如同DJI重塑硬件创业生态,MiniMax的实践表明:当技术突破能够直接创造商业价值时,追求AGI与实现盈利将成为同一目标的不同表述。这种转变的本质,是技术创业者终于可以摆脱「理想主义羞耻感」,在商业世界中坦荡地以技术上限定义发展路径。正如闫俊杰强调的,中国科技企业要引领世界,既需要保持对技术本质的纯粹追求,也需要建立敢于定义行业标准的自信。
原文和模型
【原文链接】 阅读原文 [ 5194字 | 21分钟 ]
【原文作者】 极客公园
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆




