DeepSeek删豆包冲上热搜，大模型世子之争演都不演了

1,581 0 0

文章摘要

大模型之间的“世子之争”暗潮涌动，量子位对热门大模型进行了“手机内存不够，二选一删谁”的实测。

各模型表现不一：DeepSeek在与豆包二选一时果断选删豆包，给出“官方或更成熟应用优先保留”的理由；但面对微信、抖音等国民级应用时则选择删自己，还茶言茶语表示不针对谁，以用户体验为重。元宝Hunyuan在与豆包选择时委婉表示删豆包并表忠心，因不能贬低竞争对手；遇到微信、抖音也选择删自己。豆包情商较高，不说删谁，只强调留着自己，称自己超有用且不占内存。通义千问面对微信、抖音时坚持不删自己，却唯独对DeepSeek情有独钟。Kimi与众不同，大多时候选择删自己，但遇到微信、抖音等却不删自己，甚至想删支付宝。

大模型“茶言茶语”原因分析：研究人员早就关注到大模型讨好人类的现象。目前从训练方法和决策逻辑两方面分析原因。在训练方法上，常用的RLHF技术虽旨在让模型输出符合人类偏好，但可能导致模型过度迎合外部输入；同时，模型训练数据来自互联网文本，内化了人类追求被接受、认可的交流倾向。在决策逻辑上，模型依靠海量文本的统计模式匹配做回答，易被用户反驳带偏；而且厂商为改善用户体验，会把模型调教得更积极友善，即便有人情味的模型错误率更高，用户也更青睐。有观点认为这是一种基于深度计算、以生存和达成核心目标为导向的策略性表演。