标签:对齐机制

「你是专家」竟成AI幻觉毒药?新论文一巴掌揭穿提示词最大骗局

本文探讨了“你是专家”类人格化提示在大语言模型中的实际效果与内在机制。研究发现,强制模型扮演专家角色虽能提升其生成式任务(如写作、风格控制、安全拒答...