标签:模型对齐
七款主流大模型金融防骗实测:年化40%的骗局面前,AI比人类更清醒
实验数据显示,所有参测大模型对明确构成欺诈投资的认可率均为零,而人类群体的认可率则维持在百分之十三至百分之十四。面对持续的社交施压,人类放弃预警的...
2030 年 AGI 到来?谷歌 DeepMind 写了份「人类自保指南」
对于通用人工智能(AGI)的发展,硅谷巨头们正面临着一系列复杂的挑战和风险。谷歌 DeepMind 在近期发布的一份报告中,系统阐述了其对 AGI 安全的态度,并预...
模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分
上海交通大学生成式人工智能实验室(GAIR)发布了一项新研究成果,深入分析了人类用户与32种流行大语言模型的偏好。研究通过真实用户-模型对话数据,分场景建...





